第2部首を使った漢字変換用システム辞書ファイル

第2部首を使った漢字変換用システム辞書ファイル



導入法



①ファイルをダウンロードする。
 Windows 8 (IME2012)以降で使えます。

漢字第2部首上載用 2017.07.11(2.52MB)


 更新履歴

  ・2017.07.11

  ・2017.07.10夜

  ・2017.07.10昼

  ・2017.06.29

  ・2017.06.28

  ・2017.06.19

  ・2017.06.17



 Windows 7(IME2010)以前では正しく認識されなかったと思います。旧IME用も作れないことはないんですが、ファイル生成に時間がかかるので作っていません。需要があればやります。
追記:Windows 7以前用作りました。

漢字第2部首上載用 IME14 2017.07.26(1.99MB)


 更新履歴

  ・2017.07.26


 Windows 7 のIME2010で動作確認はしてあります。IME2010は無料配布されているのでWindows 7より前のOSでもインストールは可能です。

 なお、Windows XP、Windows 2000及びWindows NT標準搭載のIMEでの動作確認はまだしていません。
 Windows Vista及びWindows Server 2003、Mac、Linuxは持っていないので確認出来ません。


②7Zファイルを解凍する。
 7Z形式のファイルを解凍するには別途ソフトが必要ですが、無料で入手可能です。

 2ndradical_yyyymmdd.dicというファイルが出て来ます。yは西暦、mは月、dは日を表す数字が入っています。例えば2017年7月11日更新のものであれば2ndradical_20170711.dicです。

③デスクトップ画面右下、IMEにマウスカーソルを合わせて右クリック
2ndradical_1.png


 以下、Windows 10 Creators Updateでの画面で説明しますが、他のバージョンもやり方は基本的に同じです。

④プロパティ(R)をクリック。
2ndradical_2.png


⑤詳細設定()をクリック。
2ndradical_3.png


⑥辞書/学習をクリック。
2ndradical_4.png


⑦追加()をクリック。
2ndradical_5.png


⑧矢印の場所にファイルをドラッグ&ドロップで移動する。

 この例ではC\Windows\IME\IMEJP\DICTSが自動的に開かれていますが、OSのバージョンによって場所は違っているかも知れません。

2ndradical_6.png


⑨続行()をクリック。
2ndradical_7.png


⑩開く()をクリック。
2ndradical_8.png


⑪□をクリックしてチェックを入れる。
2ndradical_9.png


⑫適用()をクリックしてからOKをクリックして終了。
2ndradical_10.png



もちろん、一連の作業はタッチやタップ、キー操作でも可能です。各機材の環境に応じて簡短な方法で行って下さい。


使い方


例えば「」を出したいとします。

①第1部首名に偏旁冠脚の種別を追加して入力する。
2ndradical_11.png


②総画数から部首画数を引いた残りの画数を入力する。
2ndradical_12.png


③第2部首名を入力する。偏旁冠脚名は追加しない。
2ndradical_13.png


④変換する。

 変換候補が10以上の場合はTabキーを押すと横に広がります。
2ndradical_14.png


 文字の表示に関してはフォントファイルやソフトウェアの環境が影響しますが、Windows Vista以降かなり拡大されましたし、最新の状態にアップデートしていれば通常のMS ゴシックと花園明朝で大方対応できると思います。詳しいことはフォント関係を扱ったサイトを参照して下さい。
※必要なフォントがそろっているのに変換候補で漢字がちゃんと表示されない場合は「候補一覧のフォントを固定する()」のチェックが外れているかを確認して下さい。



IME2012 (IME 15, Windows 8 以降)の場合
 「変換」タブにあります。

2ndradical_15.png


IME2010 (IME 14, Windows 7 以前)の場合
 「編集操作」タブにあります。

2ndradical_ime14.png



第1部首と第2部首について


 第1部首は一般的に「部首」と言われるものそのものです。ただし、名称は大幅に変更してあります。

 第2部首は第1部首を除いた残りの部分のうち、最初に書く部分を含む部首形状を第2部首とみなして部首名を与えたものです。「漢」であれば「氵」が第1部首なので、それを除いた「𦰩」のうち、最初に書くのは「艹」の部分、それが第2部首になります。一般的な名称を使えば第1部首「さんずいへん」と第2部首「くさかんむり」になりますが、独自名称に変更しているため、「みず」と「くさき」になります。

 第1部首の場合は偏旁冠脚のいずれかを追加します。「漢」であれば左側に「みず」があるので「みずへん」。右側にあれば「みずづくり」となって「滕」などが出せます。上にあれば「みずかんむり」となって「準」が出せますし、下にあれば「みずあし」となって「𣺩」が出せます。一般的には「にょう」や「かまえ」といったものもありますが、分かりやすくするために偏旁冠脚の4つにしぼりました。
 独自の部首名については対照表を作成してあります。

部首一覧



 しかし、書き順や画数は日本と中国で異なったり、書体によっても変わってくるため絶対とは言えず、また解釈によっても変わってきます。そして各部の配置上、偏旁冠脚のどれに当たるのか判断に迷うものも少なからずあります。原則としては①偏②旁③冠④脚の順に優先順位を取っています。つまり「つくり」にも「かんむり」にも見えるものは「つくり」に、「へん」にも「かんむり」にも見えるものは「へん」になります。それでもなお判断に迷うものもあります。うまく出て来ない場合は画数を1~2画増やしたり減らしたり、考えられる部首のパターンを適当に試し、それで駄目なら検索先を他のソフトやウェブサイトに替えた方が早いです。

 また、画数や部首名の割り当ては作者が一人で一字ずつ行っていったので、間違いや矛盾を起こしているものもあります。一応一通り完成したあとに総ざらいもし、更に使っていく中でミスを見つけるたびに修正はしていますが、収録字数7万5064字となると簡短には終わりません。

 本来は私用で作ったものですし、公の場に自信を持って提供できるような完成品ではない、β版どころかα版状態ですが、まとまった量のマイナー漢字検索・変換が必要な場合は、未完成品でもなお、絶大な効果を発揮するものなので、使いこなす覚悟のある人がもしいたら、という可能性を優先してアップロードすることにしました。


 なお、登録漢字の中にたまに﹝﹞でくくられた物がありますが、これは現状1字で出せる漢字が用意されていない場合です。私用で参考までに入れておいただけで、未登録漢字全てをこうした処置で入れているわけではありません。将来的に扱えるようになれば入れ替えます。「この字は出せないのだな」と無視して構いませんが、どういう字形なのか気になる人は、数学の計算式の要領で組み立ててみて下さい。「炏」のように横に並ぶ場合は無記号です。「炎」のように上下になる場合は「火/火」になります。あとはカッコでくくられた部分を1つのパーツとして考えます。

かのひへん
かのひへん4かのひ炏=[火火]
かのひかんむり4かのひ炎=[火/火]
かたなづくり8かのひ剡=[炎刂]=[(火/火)刂]
かのひづくり12かたな燄=[臽炎]=[(刀/臼)(火/火)]
かのひかんむり8かのひ焱=[火/(炏)]=[火/(火火)]
かのひへん12かのひ燚=[炎炎]=[(火/火)(火/火)]
かのひへん29たちき爩=[火鬱]=[火{(木缶木)/冖/(鬯彡)}]
かのひあし29たちき𤓮=[鬱/火]=[{(木缶木)/冖/(鬯彡)}/火]
かのひへん31たちき𤓭=[火欝]=[火{(木缶木)/罒/(艮寸)}]




沿革


 最初の切っ掛けは、出来る限り沢山の文字が使える環境が欲しいというところからでした。特に漢字は量が多い。

 ・マイナーな漢字で標準辞書や私的な単語辞書に登録されていない漢字はネット上の漢字検索サイトに頼るか、単漢字変換でちまちま探すしかない。

 ・手書き認識は出したり引っ込めたりの手間がかかる

 ・GT検索や今昔文字鏡は字形の確認には使えるものの出したい文字を迅速にテキストとして打ち込めるわけではないし、独自のフォントファイルを複数導入して独自のコード番号が割り当てられている点で汎用性に劣る。

 ・幾つかのマイナー漢字を扱ったサイトはテキストで扱える全ての漢字を網羅しているわけではない。

 ・『汉典』が出来てからは探しやすくなったがインターネットに接続していることが前提でオフラインでの利用が出来ない。

と……何かしら問題点があり、通常の単語変換と同じような感覚で文字を打ちながらさっと探せる機能があればと思っていました。

 前世紀に使っていたワープロ専用機では扱える字数が少ないものの、漢字検索に関しては現在のMS-IMEより優れており、字音検索だけでなく総画や部首、更には2つの検索法を同時に使って候補を絞ることが出来ました。そこで、単語登録の機能を利用して自分でも往年の漢字変換と似たようなものを作ってみようと試みましたが、便利な、部首と字音の組み合わせを作るとなると膨大なパターンを用意しないといけない上に、字音を逐一調べないと知らないようなものも沢山あるので計画段階で断念。やむを得ず部首の画数別に分類した辞書を作りました。

 結果は上々で、それまでよりも遥かに簡単に目的の漢字へたどり着くことができるようになりましたが、使っているうちに問題点も感じ始めました。それは、メジャーな部首の、特に10画前後は変換候補がものすごく多くなるという点です。決して見やすいとは言えないフォントで表示された小さな字を目を凝らして探していると疲れてきますし、夏の暑い時はイライラして来ます。例えば先ほど例に挙げた「漢」ですが、最初に作った登録ファイルでは「ぶしゅさんずいへん10」で出します。第1部首を一般名で入力して部首を除いた残りの画数を入力する形になりますが、変換候補はこうなります。


2ndradical_16.png

2ndradical_17.png

2ndradical_18.png

2ndradical_19.png

2ndradical_20.png

2ndradical_21.png


 候補が245字も出て来ます。たくさんの字を扱えるのはけっこうですが、多過ぎると効率も悪い。もう一段階しぼる必要があるなと感じ始め、色々思案した結果出たのが部首を更に設定するというものです。これなら既に作ったデータベースを利用でき、字音や字訓を個別に調べる手間もかからない、膨大なパターンを作る必要も無い。こうして第2部首の命名という作業を開始しました。

 実際に部首を与えるという作業をやってみると、自分はいかに部首が頭に入っていないかを思い知らされました。『康煕字典』分類では200ほどの部首が設定されており、台湾の『異󠄂體字辭典』や大修館の『大漢和辭典』はもちろん、その他の中小の漢和辞典もこれがベースになっているので、ある程度漢字に触れる経験があれば目にしたことあるものばかりですが、1つの漢字を見てそこから最初の筆画を含む部首のセットを瞬時に間違いなく見抜いて流れ作業で膨大な漢字に次々と命名していくとなると、これだと思っていたものがあとから考えると違うとなって再びやり直しになったり、どっちなんだろう?と迷ったり。文字だけを扱うのでも大変なのに、字義や出典も含めて扱い、しかも何回も5万字以上全体に目を通して推敲していた諸橋轍次氏の凄さに改めて感服もしました。しかも私はTVを見たり音楽を聴きながらキーを叩いていただけですが、『大漢和辭典』制作はワープロも無い時代、しかも一度戦争で焼けて再び作り直していますからね。辞書を作る前、子供の頃から漢籍に関わるノートも既に作り始めていたようですし、レベルが違います。

 パソコンで作業すると楽なのは一括置換や検索が出来る点です。しかしここでも問題点が出てきました。既存の一般的な部首名は、例えば「身」だと「み」です。「工」は「たくみ」なので「み」を含みます。検索すると当然どちらも引っかかってきますし、「み」を「みへん」に変えようと思ったら「たくみへん」にも変わってしまいます。それを忘れて「たくみ」も「たくみへん」に変えてしまうと、あとになって「たくみへんへん」になっていることに気づきます。そこで修正作業をする、置換条件を複雑に設定する……と面倒が出てきます。あとからやっぱり変更しようと思っても、どこが連動するのかを慎重に検討しないとうかつにやれば大変なことになります。直ぐに気づけばやり直し機能やバックアップ機能で戻せますが、気づかないまましばらく経ってしまうと、再修正もバックアップを使ってやり直すのも非常にやる気を削がれます。

 また、「立」と「辰」と「龍」は共に「たつ」です。「たつへん」としても解決にはなりません。何かしら区別をつけないといけない。更に、部首と残りの画数だけで分けてもまだ多いケースも出てきました。先程挙げた245の候補は偏部に来る「さんずいへん」の10画だけで、それ以外の場所は含まれていません。「さんずい」の10画全てとなると更に152字増えます。その多さも問題になって偏旁冠脚に細分化することにしたのですが、そうなると脚部に来ても「さんずいへん」はおかしいとなります。そこで「さんずいあし」としますが、例えば「儿」は元々一般名が「ひとあし」と既に「あし」が入っています。抜くとただの「ひと」になり、偏部に来ると「ひとへん」になり、「亻」は「にんべん」ですから、混乱します。「にんにょう」という言い方もありますが、「にょう」を抜いてもやはり解決しません。更に「彳」は「ぎょうにんべん」「ぎょうにんあし」等とすると、「にんべん」「にんあし」と重複して置換に面倒が出ます。

 部首名は小学生の頃から馴染みがあって今更一から覚え直すのも面倒でしたから、名称は出来る限り変更したくなかったのですが、その場しのぎで逐一変えていてもキリがないので思い切って独自に部首名を設定することにしました。名称は原則、部首の持つ本来の意味を採用しています。「ぎょうにんべん」は「行」という字に使う「にんべん」のような形をしたものだから「ぎょうにんべん」なだけで、「彳」そのものに「ギョウ」という読み方は無いですし、意味は「たたずむ」です。なので部首名も「ぎょうにん」ではなく「たたずむ」にしてしまおうと。これなら辞書によって異なる名称も統一できる、検索や置換時の面倒も解消できる、本来の意味も覚えられるので一石三鳥だなと思って作業を開始しましたが、今度は部首本来の持つ意味が重複しているということに気づきました。漢字が古くは対称性を重視されていたことと関係あるのか理由は知りませんが、「さからう」「そむく」「たがう」の意味を持った部首が多い。「艮(こんづくり)」「癶(はつがしら)」「舛(まいあし)」「非(ひ)」「韋(なめしがわ)」がそうです。そこでこれらは少しずつ表現を変えています。

 このように、既存の部首名をそのまま採用すると処理上の問題点が多いことから独自名を採用したものの、既に部首名をある程度覚えている中級者にとっては使いにくく感じると思います。部首の字形が持つ本来の意味を知っている上級者はすぐに慣れると思いますし、かえって今まで部首名を気にしたことがなかった初級者や外国人学習者で部首による漢字の把握に意欲的な人の方が余計な先入観が無く、向いているかも知れません。それを考えれば外国語による説明も作っておいた方が良いような気もしますが、作者にとって辞書を使わずスラスラと書ける言語は日本語だけなので、他の言語に関しては翻訳機能や翻訳しても良いという奇特な方の出現に任せます。



2017年=平成29年6月28日 Marimó Castellanouveau-Tabasco記
2017年=平成29年7月10日補足修正
2017年=平成29年7月22日誤記修正
2017年=平成29年7月26日IME14用ファイル追加