# これ以外にも細かい補正は随時行っています。

2018-07-22
・update mecab-user-dict-seed.

2018-06-04
・mozcエントリと読みが同じで表記が異なるutエントリを収録するときのコスト計算を修正。
	「鈴木奈々」より「杉木奈々」が優先されていた。
・人名のコスト計算を変更。
・辞書生成スクリプトのファイル名を変更。
・filter-mozc.txt と filter-mozc-entries.rb を削除。
	公式辞書には別のフィルタが入ったようなので。
	neologdのほうは以前と同じフィルタを適用。
・update mecab-user-dict-seed.
・add a patch for gcc-8.1.
	https://github.com/google/mozc/issues/441#issue-321728877

2018-03-07
・dependency change: use Qt5.
・update mozc version to 2.23.2815.102.
・update fcitx-mozc.
	See fcitx-mozc/README.md
	https://github.com/fcitx/fcitx/issues/403
・update mecab-user-dict-seed version to 20180301.

2018-01-03
・mozc-2.23.2785.102 に追従。
・mecab-user-dict-seed を最新版に差し替え。

2017-10-07
・neologdエントリがmozcエントリと同じ読みを持つ場合、双方のコストを比較するようにした。
	mozcdic-ut2で追加辞書のコストをかなり上げたにもかかわらず、
	「幾つかの」が「いくつかの」より優先されることがあったので。

・mozc公式辞書のエントリをフィルタリングするようにした。
	・src/filter-mozc.txt に含まれる表記を除外する。
		/\A似非/ のような正規表現も使用可能。
	・「殆ど　ほとんど」のようにタブ区切りで2つの単語が並んでいる場合は、
	前者の表記から後者の表記を生成して追加する。
	追加した表記はもとの表記より優先度を高めにする。
		mozcの辞書には「殆どxx」という表記はあるのに、
		「ほとんどxx」という表記はないことが多く、
		文章が硬く見えるので。

・郵便番号辞書を生成するときにmozc公式辞書に追記しない形にした。
	mozc公式辞書は後で重複チェックの処理が入るので、
	郵便番号辞書があると重複チェックに時間がかかる。
	郵便番号辞書は他のエントリとかぶることがないので、
	重複チェックの必要はない。

2017-10-04
・mecab-user-dict-seed を最新版に差し替え。
・収録する表記の最大文字数を20に減らした（以前は24）。
・数字を含む表記を削除した。
	「712円」「青森県道39号」「第1231話」などキリがないので。
・「カブシキガイシャ」などの煩雑なエントリを削除した。
	src/get-neologd-entries.rb を参照。

2017-10-02
・mecab-user-dict-seed を最新版に差し替え。
・ソースのコメントを整理。

2017-05-29
・mecab-user-dict-seed を最新版に差し替え。

2017-03-20
・mecab-user-dict-seed を最新版に差し替え。

2017-01-16
・mecab-user-dict-seed を最新版に差し替え。

2016-12-15
・mozc-2.20.2677.102 に追従。
・fcitx-mozc-2.18.2612.102.1 に追従。
・mecab-user-dict-seed を最新版に差し替え。

2016-11-21
・mozc-2.19.2663.102 に追従。
・mecab-user-dict-seed を最新版に差し替え。

2016-11-15
・mecab-user-dict-seed を最新版に差し替え。

2016-10-24
・mecab-user-dict-seed を最新版に差し替え。

2016-10-20
・mecab-user-dict-seed を最新版に差し替え。
・人名を一括変換しにくいので品詞idを「名詞,一般,*,*,*,*,*」のidに統一した。

2016-10-17
・辞書生成を高速化。
	正規表現を配列から毎回整形して作らずにあらかじめ作っておく。
	カタカナをひらがなに変換する処理はtrではなくnkfで行う。
	全角英数・全角記号を半角に変換する処理はtrではなくnkfで行う。
・filter.txtの正規表現エントリを // で囲むようにした。
・change url in pkgbuild.

・mecab-user-dict-seed を最新版に差し替え。

2016-10-13
・change the directory structure and file names.
・mecab-user-dict-seed を最新版に差し替え。
・コスト計算を一部簡略化した。

2016-09-05
・update get-latest-mozc.sh
・update generate-mozc-tarball.rb
	keep original documents and the directory structure.

・mecab-user-dict-seed を最新版に差し替え。

2016-08-15
・update generate-mozc-tarball.rb
・mecab-user-dict-seed を最新版に差し替え。

2016-06-27
・update get-latest-mozc.sh

・mecab-user-dict-seed を最新版に差し替え。

2016-05-24
・update get-latest-mozc.sh
	simplified.

・mecab-user-dict-seed を最新版に差し替え。

2016-04-19
・mecab-user-dict-seed を最新版に差し替え。

2016-03-18
・「都道府県+市+町域」のエントリを削除した。
	辞書データが膨らみすぎるので。

・mecab-user-dict-seed を最新版に差し替え。

2016-03-03
・地名生成コードを更新。
	・町域の数字の読みがなを改善。

・mecab-user-dict-seed を最新版に差し替え。

2016-02-29
・辞書生成コードを更新。
	・同じ読みの人名が続いたときは辞書に多く含まれる表記を優先する。
		冠番組を持つタレントなどが優先される。
		(例) 中井正広, 中居正広, 仲居正広, 中井正広のブラックバラエティ, 
		中居正広のボクらはみんな生きている, 中居正広のミになる図書館
		この場合は出現数の多い「中居正広」の表記を優先する。

	・品詞をIDに変換する処理にバグがあったので修正。
		高速化するために導入した処理だったが、
		バグがあった上に直してtimeを測ってみると速くなっていなかった。
		高速化のために条件を加えるとその処理に時間がかかって、
		差し引きゼロになってしまうことがある。

	・単語の収録範囲を広げた。
		「16文字以内の読みを持つ単語」から
		「16文字以内の表記を持つ単語」に緩和した。
		あまり文字数を増やすとサジェストウィンドウが大きくなるので注意。

	・neologdの住所エントリを使わないようにした。
		住所エントリは郵便番号データから自前で作成する。
		neologdでは自動作成された(?)短縮エントリが多く、辞書が肥大するので。
		(例) 徳島県春日町,トクシマケンカスガチョウ
		正式な住所は「徳島県徳島市春日町」

		最新の郵便番号データを使うと最新の住所を入力できるし、
		巨大な住所エントリを分離することで辞書生成が多少速くなる。

・郵便番号データ関連のコードを更新。
	・町域の読みにある数字をカタカナに変換。
		(例)「3ジョウ」を「サンジョウ」に。

	・地名生成のためのコードを整理。

・フィルタを更新。
・mecab-user-dict-seed を最新版に差し替え。

2016-02-26
・辞書生成コードを更新。
	fix-jinmei.rb を実行した後のコストがマイナスにならないようコスト計算を変更。

・フィルタを更新。
・mecab-user-dict-seed を最新版に差し替え。

2016-01-25
・辞書生成コードを整理。
・辞書生成を少し高速化。

・人名の判定を変えた。
	fix-jinmei.rb
	同じ読みのエントリが続いたときに片方が人名で片方がそれ以外の場合、
	人名の表記を優先する。
	人名だと判定されなかったエントリは品詞を人名に変え、優先度を下げる。

・フィルタを更新。
・mecab-user-dict-seed を最新版に差し替え。

2016-01-21
・フィルタを更新。
・mecab-user-dict-seed を最新版に差し替え。

2016-01-18
・辞書生成スクリプトを更新。
・フィルタを更新。
・mecab-user-dict-seed を最新版に差し替え。

2016-01-15
・正規表現でフィルタリングできるようにした。
	正規表現の場合は頭に / を付ける。
	多用すると辞書生成が遅くなる。

2016-01-14
・first release.
