UnifDrippは青空文庫テキストツールシリーズの一つで、
現行のX0208テキストをX0213テキストに変換するための補助プログラムです。

使い方は例によって、X0208テキストをドラッグ＆ドロップしてください。
ファイル名_unif.txtという、包摂対象漢字と、その候補が一覧になったテキストファイルが出来ます。
このツールが行うことはそれだけです。

あとは、リストの1カラム目の文字と、3カラム目の行数、4カラム目の文字数を元に、
底本を確認して、2カラム目の２つ並んだ文字のどちらが使われているか、
使われている方を残して、使われていなかった方を削除してください。

こうして編集して、保存したファイルが、次の（本当の意味での）X0208テキストをX0213テキストに
変換するツールへの入力（指示書）になります。

UnifDripperを使う上で必要なのはここまでです。
これ以上の説明はいらないと思ったら、ここでこのファイルを閉じてください
もう少し詳しく知りたいと思ってくださった方はもう少しおつきあいください。


青空文庫テキストのJIS X0208→JIS X0213変換は２つのプログラムに分けて行います。

なぜかというと、JIS X0208テキスト（以降08txtと呼びます）をJIS X0213テキスト（以降13txtと呼びます）に変換するためには「X 0213にならあるけれど、それをこの文字で代用すべし」とされた漢字があり（これを包摂といいます）この包摂された文字を底本の確認によって、第一、二水準の文字のままでよいのか、第三、四水準にある異字体に置き換えなければならないかを人が判断しなければならないからです。

そこで、08→13はプログラムを
・一つは包摂の対象となる漢字を抜き出してリストにし、底本の確認の補助をする
・もう一つは、底本の確認結果を元に、書き換えるべき包摂対象の文字の置換と、外字の文字コード化を行う
と、人の判断の入る前と後に役割で２つに分けました。

このプログラム(UnifDripper)は、上の一つ目の、包摂文字の抽出を行うプログラムです。

絵にすると、こんな感じになります。
左下のX0208テキストから、右に移動し、このプログラムによって、包摂漢字一覧を作るところ
までがこのプログラムの役割です。
次に、

　　　　　X0208←→X0213変換の流れ

X0213テキスト　→　　染み抜き君　　→　X0208テキスト、変換ログ
　　　↑　　　　　　　　↓　　　　　　　　　
　　Unison　　←　包摂変換指示表
　　　↑　　　　　　　　↑
　　　｜　　　　　　人手編集（底本の確認）
　　　｜　　　　　　　　↑
　　　｜　　　　　　包摂漢字一覧
　　　｜　　　　　　　　↑
　X0208テキスト→ 　UnifDripper

一番上の→がテキスト新規入力時の流れ
・染み抜き君が、X0208テキストと変換ログ、そしてX0213に戻すための変換指示書を作成する。

下から上への↑が、既存作品をX0213化する流れ
・まず、UnifDripperで、包摂されているかもしれない文字の一覧を作る
・包摂一覧を元に底本を確認し、候補のどちらの漢字かを選択する

右から左への←が、X0208テキストを変換指示書を元にX0213化する流れ
・変換指示書に元テキストの場所が書かれているので、そのテキストをX0213化する
・指示書に記載のある（包摂対象）文字の置換
・外字注記の文字化
・ファイルフォーマットの変換
