縦書き日本語文を主な推定対象とした、 校正校閲用マークアップ言語 という可能性について、XML,XSL,SXLT,SXL-FO,TeX などについて触れながら検討しています。実装可能なようでもあり、商業出版の現行の慣習上難しそうでもあり、という感触があります。元の議論は、円城塔さんから始まる「小説におけるdiff」の話を御覧ください。https://min.togetter.com/p9lBL8K 文中では #校正校閲対応マークアップ言語 と書いてましたが、「対応」を「用」に変えておきました。
1
tricken(手術後復帰チャレンジ中) @tricken

@t_tutiya あ、それは同意です>文章構造と組版をわけてかんがえる XML基準だとXSLTとXSL-FOの分離が、その立場にあたると未明に教えてもらいました。

2020-11-15 14:06:46
tricken(手術後復帰チャレンジ中) @tricken

『基本日本語文字組版』1999年.逆井克己.日本印刷新聞社. amzn.to/32M4rpp

2020-11-15 14:08:49
tricken(手術後復帰チャレンジ中) @tricken

Rubyベースなんだ。縦書対応はどうかな> 第548回 書籍制作を支援するソフトウェア「Re:VIEW」を使う:Ubuntu Weekly Recipe|gihyo.jp … 技術評論社 gihyo.jp/admin/serial/0…

2020-11-15 14:14:52
tricken(手術後復帰チャレンジ中) @tricken

RE:VIEWの縦書実験について review/writing_vertical.ja.md at master · kmuto/review · GitHub github.com/kmuto/review/b…

2020-11-15 14:15:35
tricken(手術後復帰チャレンジ中) @tricken

縦書き、何かのコマンドラインによる処理に加えてさらにTeXの力技でねじ伏せる、みたいな解決が多く、あまりスマートな解法がまだ生まれてない気配がする

2020-11-15 14:19:39
tricken(手術後復帰チャレンジ中) @tricken

@t_tutiya 円城さんのdiffの後に出てきた話のポイントを自分なりに考えると、「JIS規格+各社ルールに則った紙組版になった(postscript言語などの)ファイル」と「epub3ほか電子書籍+各社ルールにのっとった電子書籍組版」、双方の元になる「原データ」をやりとりするXSLT & XSL-FOの標準規格があれば、なのかな

2020-11-15 14:34:46
tricken(手術後復帰チャレンジ中) @tricken

あくまで「XML的な処理から紙組版&電子組版それぞれにデータを受け渡す」という前提の話。最初から紙だけ、最初から電子だけ、の話は今は考慮してない。

2020-11-15 14:37:13
アサヒ光學 @asa_hit

LIS分野で世界的に見るとHTMLやePubの標準策定に参与したひとというのは (全体に対しては少数だとしても) いるはずだし、「出版・印刷史」というのはLISの一分野なわけですが、両者の接点って (そしてそれが「組版」に結節することって)、考えられないわけじゃないけど微妙に少なそう。 twitter.com/tricken/status…

2020-11-15 14:38:56
tricken @tricken

@t_tutiya 図書館情報学に「組版学(紙部門・電子部門)」があれば、そしてワーキンググループとかが数年がかりで動いてデジュールスタンダードを定めるなど、文化庁かどこかのトップダウンで変えてゆく方向性ができそうだけど……。(実務寄りでフォント研究等やってる人はよく見るけど、組版そのものは知らない

2020-11-15 14:02:25
tricken(手術後復帰チャレンジ中) @tricken

@t_tutiya 京極夏彦WGの話かーーーッ news.livedoor.com/article/detail… いや実際、京極さんと円城さん、二人を支えてきた編集&印刷チームが(※作家の本分としての執筆業が犠牲になるのはファンとしてつらいが)エイヤッと調整したらこのあたり一気に解決して電子組版立国日本ができる気がしてますよ能天気無責任に!

2020-11-15 14:40:14
tricken(手術後復帰チャレンジ中) @tricken

@t_tutiya 京極さんは恐らくInDesignのバイナリファイルに立脚した紙/電子組版の整理まではやっていて、円城さんは編集に渡すまでのgit,diff,自然文処理用のプログラミングなどによる原データ管理まではやってる(なお結城浩さんはTeXをgit,diffで管理してるとのことだが横書き前提)。なんとか組み合わさらんか

2020-11-15 14:43:43
アサヒ光學 @asa_hit

「印刷された文字とテキストデータの間の自由な変換性」というのはデジタルヒューマニティーズとか、いわゆる「デジタルアーカイブ」の分野における興味でもある (し、そこにはLISも噛んでる) んですが、それもまた、執筆・出版実務者のニーズとは異なる実務者のニーズに基づく興味ではあるかなあ。

2020-11-15 14:46:47
土屋つかさ @t_tutiya

@tricken 土屋自身は縦書きだから出来ないってことはないと思いますよ。お金にならないからやってる人がいないだけで、その点については技術的困難があるとは思わないです。

2020-11-15 14:46:53
tricken(手術後復帰チャレンジ中) @tricken

商業字書きさんがみんなハッピーになれるような、"縦書きの" #校閲校正対応マークアップ言語 があればいいのにね、という一市民の素朴な希望から色々駄弁ってますが、横書きならもうだいぶ出揃ってるので、縦書き組版という領域がやっぱ職人的難しさのある、ITが捌き切れぬ色々があるんだろうなと思う

2020-11-15 14:51:10
tricken(手術後復帰チャレンジ中) @tricken

横書きならTeXやXSLT&XSL-FO(Oくん紹介で知った)やRE:VIEW(これは先程土屋さんの紹介で知った)などで出揃ってる。また縦書の「電書」に限れば、たとえば商業小説家の佐藤亜紀さん・佐藤哲也さんは自分達のWordPressサイトでepubほかの電書を売ってる。

2020-11-15 14:54:22
enjoetoh @EnJoeToh

僕は全然データ管理してないですけどね。(今までの話は一体。

2020-11-15 14:56:29
tricken(手術後復帰チャレンジ中) @tricken

ただ【日本語-縦書-紙/電子両方を目指した文書構造&組版】の、その手前で、関係者で校正校閲ができるような原データの検討ができるようなマークアップ言語となると、まだないんだろうな、という話。「結局別のものになるし、べつのものを目指すよ」と言ってしまえばおしまいかもしれないけど。

2020-11-15 14:58:40
tricken(手術後復帰チャレンジ中) @tricken

@t_tutiya なるほど>お金にならないからやってるひとがいない ……出版社のデキる編集者を捕まえて、やらせることがひたすら間違えそうなリスクの高いゲラとの取っ組み合いというのは、人件費の無駄遣いとも思えるんですが、それがまじめに勘定に入ったらこの話はめっちゃカネに直結すると思う……。

2020-11-15 15:01:37
tricken(手術後復帰チャレンジ中) @tricken

「型式段落」と「意味段落」という用語の使い分けが未だに腑に落ちてないですね、そういえば……。 twitter.com/t_tutiya/statu…

2020-11-15 15:03:48
土屋つかさ @t_tutiya

もっと言うと、そもそも英語文の「パラグラフ」と日本語文の「段落」は別の物の筈で(よく知らんけど。きっと誰か知ってる人が詳しく教えてくれるはず)、それを、どう対応づけるのか(対応づけられるのか)も課題かなと思う。

2020-11-15 14:13:47
tricken(手術後復帰チャレンジ中) @tricken

@asa_hit web文書規格、電子書籍文書規格、紙組版規格(JIS)、各々のアプリやスクリプトの規格……それぞれハッキリと出自はありますが、「いま、ここから{紙,電子}両方に向けて、複数の組版に適切にコンパイル可能な文書を拵えるための規格」というのが、考えてみるとめちゃむずだなー、と考えてました。

2020-11-15 15:08:53
アサヒ光學 @asa_hit

あと、本題から外れますが、LISにおける「出版・印刷史」って、稀覯本 (rare books) に対する「製紙、印刷技術史」的なところが大きくて (現場でそのニーズが多いのはわかる)、「出版史」といえども「完成した本の組版における編集者の役割」みたいな人文的な側面はあまり開拓されてない気がする。

2020-11-15 15:09:03
tricken(手術後復帰チャレンジ中) @tricken

円城さんはそこまでやってなかったそうです。誤情報を書いてしまい、すみません(手元で小説テキストをまんべんなくgit管理等してるわけではない、ということでよいのでしょうか) twitter.com/EnJoeToh/statu…

2020-11-15 15:13:11
土屋つかさ @t_tutiya

@tricken 校正だけの話なら、現状でもInDesignのデータ送ればいいし(出版社には必ずある).なんならPDF化すればいいわけで、学習コスト含めてそれと戦える省コスト化できるかは、考えどころだと思います。土屋は長年そういうマークアップ言語が欲しいと思っていた(いる)けど、この辺が理由かなと思ってます

2020-11-15 15:16:48
enjoetoh @EnJoeToh

ほとんどの場合、wordの最終稿がフォルダに分かれているだけですね。それか、gmailが記憶している。 そこから後の工程は、(戻りとして)紙かpdfになってしまうので、基本的に検索が効かない世界になります。 twitter.com/tricken/status…

2020-11-15 15:17:28
tricken(手術後復帰チャレンジ中) @tricken

@EnJoeToh 一度組版ファイルになってしまうと、プレーンテキストの時のように扱えなくなる(しかしカーニング等、出版専門職の仕事の出来栄えも確認しなければならないフェイズに入るから現状はその状況を受け入れざるを得ない)というふうに昨晩の連投を読んでおりました。

2020-11-15 15:22:48
アサヒ光學 @asa_hit

ところで、英語圏で学術出版だと、日本でいう「ゲラ」みたいな段階でもう「タイプセット終わってるから、ここからは基本、誤字脱字以外直さないでね」(文章の大幅な改変は不可。やったら追加DTP料金が発生する) と言われたこともあるので、やっぱりなんかプロセスが違うんだろうな……。

2020-11-15 15:38:59
tricken(手術後復帰チャレンジ中) @tricken

@asa_hit もしそうなら、と仮定して、誰かLIS関係者で科研費なり外部資金なりとってデジュール組んでほしいなーっ! ああだれかそういう計画書書けるひといないかなーっ!(チラッチラッとTLのLIS方面をみやる

2020-11-15 15:40:20
murashit @murashit

まじめな話、いきなりゲラを組むようなことをせず原稿のままちゃんと校正してればああいう話そんな出ないと思うんだよな(プレゼンテーションにつなげるのはなるべく遅延させるべきだと思うし、そこでの直しは基本プレゼンテーションに関するものに限るべきだと思う)

2020-11-15 15:50:52
tricken(手術後復帰チャレンジ中) @tricken

@asa_hit ですよねえ(元からほぼLIS方面じゃないのでお気楽無責任やろうなひと)

2020-11-15 15:52:30
tricken(手術後復帰チャレンジ中) @tricken

いま「デジュールスタンダード」って「デジュリスタンダード」で定着したのねー。

2020-11-15 15:55:59
アサヒ光學 @asa_hit

@tricken 「基礎研究」としての「電子書籍時代における作家、編集者、出版社、印刷社等の作業分担の参与観察による日米比較研究」とかどうですか。(どの分類なのかよくわからないテーマを提案するな) (あと「参与観察」部分がめっさ嫌がられそう)

2020-11-15 16:03:37
tricken(手術後復帰チャレンジ中) @tricken

@kilica 版組XMLの規格であるXSLのうち、XSLT & XSL-FO の、FO側で縦組の行末処理やルビ振り規則を指定してやる必要がありそうですね。それをちゃんとやろうとすると、アンテナハウスさんのお世話になる確率が非常に高い……antenna.co.jp/AHF/

2020-11-15 16:13:42
1