あんまりTogetter で広めたい話題でもないので、ほそぼそと。円城さんの提案を中心にしてます。
3
enjoetoh @EnJoeToh

小説業界にプログラミングが浸透しないのは、手作業でやってやれないわけではない、という絶妙な分量のせいな気がして、そのくらいの分量のものが小説である、という感覚はあります。

2020-11-14 16:53:07
enjoetoh @EnJoeToh

小説業界にバージョン管理という概念がないのは、電子書籍のバージョン管理がなされていないことからも明らかではないでしょうか。

2020-11-14 17:08:38
mizchi @mizchi

プログラミングと執筆両方やる人間からすると、プログラミング実行環境は厳密すぎて一行一行意味があってdiffが必要だけど、執筆は前後のdiffがあまり意味ある感じにならなくて、「こっちの表現が良いですね」ぐらいの指摘に叱らないので、自然文の差分バージョン管理という発想が微妙な感じがしてます twitter.com/EnJoeToh/statu…

2020-11-14 21:57:56
enjoetoh @EnJoeToh

何万字もある二つのテキストの異なる箇所を人間が探すのは無駄というくらいの意味でdiffは必要だと思います。 twitter.com/mizchi/status/…

2020-11-14 22:05:11
enjoetoh @EnJoeToh

diffを取らないで、修正箇所が反映されているのかを確認するのも難しいと思う。

2020-11-14 22:06:37
enjoetoh @EnJoeToh

そもそもdiffを取りうる環境になっていないことがまずい。

2020-11-14 22:08:14
enjoetoh @EnJoeToh

diffがとれないと、修正の反映漏れが起こり、それを校閲さんが指摘し直して、そこを修正すると他の場所が前に戻ってて、などが起こりますね。

2020-11-14 22:14:48
enjoetoh @EnJoeToh

旧来の出版は、紙の上で最終調整が入り、データには反映されないので。 twitter.com/h_ueno/status/…

2020-11-14 22:16:30
enjoetoh @EnJoeToh

印刷所が保持しているのも、レイアウトのメタ情報と絡みあったデータではないかと思う。

2020-11-14 22:17:32
enjoetoh @EnJoeToh

まずテキストとしてのデータを確定させる、そこから紙用と電子用を分岐させるのが筋でしょうと言い続けているけれど、そもそもの意味が理解されていないと思う。

2020-11-14 22:19:21
h_uenoあなたは最後に涙が出るほど笑ったのがいつだったか思い出せるだろうか @h_ueno

@EnJoeToh 御意。尤も、”普通の” (ここ重要)小説ならMarkDownでもLaTeXでもRE:Viewでも最終型データで残せる感覚ですが

2020-11-14 22:20:12
enjoetoh @EnJoeToh

自分ではやれますが、出版社とのやりとりですね。戻ってくるデータはほとんどの場合、画像です。 twitter.com/h_ueno/status/…

2020-11-14 22:21:33
enjoetoh @EnJoeToh

自分ではテキストだけで閉じるんだけど、外に出すとすぐ画像データになって返ってくるのがつらい。

2020-11-14 22:27:18
h_uenoあなたは最後に涙が出るほど笑ったのがいつだったか思い出せるだろうか @h_ueno

@EnJoeToh ううむ…そうなのですね RE:Viewの発想に近いとは思いますが、結局Rubyとか駆使いないとなかなか納得の行く最終型は見えませんし Vivliostyle (HTML5/CSS組版)とかどうなんでしょうかね

2020-11-14 22:31:47
enjoetoh @EnJoeToh

校了データをPDFでもらえる場合も増えているけれど、そこからテキストを抜き出せるかはまた別の問題でな……。

2020-11-14 22:32:44
enjoetoh @EnJoeToh

紙は非常に特殊な媒体で、字詰めの発想とかが電子とは根本的に異なっているので、紙は紙、電子は電子とするしかないとは思います。 twitter.com/h_ueno/status/…

2020-11-14 22:34:42
enjoetoh @EnJoeToh

編集さんの仕事にカーニングが入っていて、テキストの修正と同時に行われるのが切り離せない一因。

2020-11-14 22:37:34
h_uenoあなたは最後に涙が出るほど笑ったのがいつだったか思い出せるだろうか @h_ueno

@EnJoeToh なるほどです XMLで持っている.docxがPDFより素性が好いとかのレベルではないんですね

2020-11-14 22:38:15
enjoetoh @EnJoeToh

この字をちょっとズラすと一行に入る、とかの、活字的発想(特に新聞に強い)ですね。(紙面のデザインとしては重要。 twitter.com/h_ueno/status/…

2020-11-14 22:41:28
enjoetoh @EnJoeToh

文字渦でも、ほぼunicodeで参照できるので、あとは例外用のマークアップだけあれば。

2020-11-14 22:42:58
enjoetoh @EnJoeToh

そうしてまた、校閲さんの超特殊技能は、かなりの割合で紙に特化されているので、一度印刷しないわけにもいかない。

2020-11-14 22:43:30
h_uenoあなたは最後に涙が出るほど笑ったのがいつだったか思い出せるだろうか @h_ueno

@EnJoeToh 府川充男さんとか逆井克己さんの次元に通じるものですね W3Cの「日本語組版の処理要件」とか地道に更新続いているようですが

2020-11-14 22:47:52
enjoetoh @EnJoeToh

出版社の実態としては、W3Cへの要望ではなく、Adobeに任せている……という感じではないかと思います。 twitter.com/h_ueno/status/…

2020-11-14 22:50:56
enjoetoh @EnJoeToh

物書きからの要望としては、どの段階のデータからでも、テキストのみを抜き出せるようにして欲しい、というだけですが、運用上これが実は難しい、という話ではあります。

2020-11-14 22:54:53
h_uenoあなたは最後に涙が出るほど笑ったのがいつだったか思い出せるだろうか @h_ueno

プロプライエタリなところだけに委ねているのは怖いので(梯子外されたら)、GPLというかOSS的なところにも片足 乗せていたいとは思いますが (QuarkXPressで痛い目見てますので…) twitter.com/EnJoeToh/statu…

2020-11-14 22:59:51
enjoetoh @EnJoeToh

電子版→紙版と作った方がまだ楽なはずなんだけど、歴史的な経緯から、紙版→電子版とつくることになっていて、フローがこんがらがっているのが現状ではないでしょうか。原稿が原稿用紙で入って活版だった頃はそれがよい解だったはずとは思います。

2020-11-14 23:01:24
enjoetoh @EnJoeToh

自社でもっているところもあって、XMLベースだとはきくのですが、その部署の人じゃないと詳細がわからなかったりです。 twitter.com/h_ueno/status/…

2020-11-14 23:03:06
h_uenoあなたは最後に涙が出るほど笑ったのがいつだったか思い出せるだろうか @h_ueno

@EnJoeToh コンテキストに従って組んでもらえると、PDF→XML→TXTもかなり使いやすくはなるんですが、そこまで(現状の単価下落相場で)組版会社さんに委ねるのはさすがに酷かなと… (尤も、逆に制約=ルール設けてもらった方がやりやすいのかも知れませんが)

2020-11-14 23:09:04
enjoetoh @EnJoeToh

なので、原テキストの確定までは出版社でやるのが落としどころではないか、と思います。 twitter.com/h_ueno/status/…

2020-11-14 23:11:11
enjoetoh @EnJoeToh

PDFの注釈機能で100個くらい入るとそりゃ嫌になるし、間違えるな、とは思う。(そうして話はdiffへ戻る。

2020-11-14 23:15:24
h_uenoあなたは最後に涙が出るほど笑ったのがいつだったか思い出せるだろうか @h_ueno

@EnJoeToh 京極夏彦が聞いたら卒倒しそう(もうそういう版元からは本出さない勢いで)なところですが まぁあのお方は例外中の例外でしょうからねw

2020-11-14 23:19:51
enjoetoh @EnJoeToh

京極さんは自分で組んでいるので。 twitter.com/h_ueno/status/…

2020-11-14 23:20:48
enjoetoh @EnJoeToh

必要なのは校正校閲用マークアップ。とそれを使える人。

2020-11-15 00:48:41
enjoetoh @EnJoeToh

小説でテキスト管理が必要なのは誤字脱字対策くらいでは? というのはわかる。あとは、初出難読漢字にしかルビつけない処理とか、漢字のヒラきとか、媒体が変わったときの同一性とか、(山椒魚的なものの)更新履歴の管理、引用時の参照箇所指定方法、とかかな。

2020-11-15 06:20:20
enjoetoh @EnJoeToh

履歴が管理されてないと研究者が普通に困るし、今も困ってると思う。

2020-11-15 06:21:43
enjoetoh @EnJoeToh

あと「正字」への置換。

2020-11-15 06:23:30
enjoetoh @EnJoeToh

小説にだってそうしたバリデート要素はあって、ルーチンなだけに負担もそれなりで、一発通せばいいじゃん、とはよく思います。

2020-11-15 06:27:02
enjoetoh @EnJoeToh

どれぐらい紙を維持したいかと、電子書籍の展望、のバランスの探り合いではないでしょうか。(そうして最終的には2つは分離する。

2020-11-15 06:44:37
enjoetoh @EnJoeToh

複数の作業者が関わる場合、コンパイルだけだとそこでフローが切れてしまうので、逆コンパイルも必要になるけれど、そこでの変更の反映、管理とかは……非常に難しいですね。

2020-11-15 06:53:44
enjoetoh @EnJoeToh

テキスト←→組版、と、修正、を、可換にするには……。

2020-11-15 06:56:43
enjoetoh @EnJoeToh

電子組版を考えていくと、電子国学が現れてくる、ということなのかもしれない。

2020-11-15 07:18:32
enjoetoh @EnJoeToh

世界文学というときはそのバージョンが問題となるのであって。

2020-11-15 13:41:12
enjoetoh @EnJoeToh

そうしてこのあたりにたどり着いている。 pic.twitter.com/j1g2lJgnBa

2020-11-15 13:51:48
拡大
enjoetoh @EnJoeToh

つきつめていくと、情報というものが人間を見捨てていく様を幻視中という感じはあり、グッドラックにつながらない雪風、みたいな。

2020-11-15 13:56:50
enjoetoh @EnJoeToh

ルーセルがある種の本を書いたのは、二文のdiffに小説が含まれてたからでしょ。という短篇をそういえば書かねばならないのだった。

2020-11-15 14:47:36
enjoetoh @EnJoeToh

diffの間に無限の書物が存在する。

2020-11-15 14:49:59
enjoetoh @EnJoeToh

すなわち、diffのアルゴリズムが小説機械なのでは、ない、か、と、いうことなのだっ。

2020-11-15 14:53:02
enjoetoh @EnJoeToh

僕は全然データ管理してないですけどね。(今までの話は一体。

2020-11-15 14:56:29
tricken(手術後復帰チャレンジ中) @tricken

円城さんはそこまでやってなかったそうです。誤情報を書いてしまい、すみません(手元で小説テキストをまんべんなくgit管理等してるわけではない、ということでよいのでしょうか) twitter.com/EnJoeToh/statu…

2020-11-15 15:13:11
3