先週ご紹介した通り、『Lingomi』というサイトから新HSK1級から6級までの必修単語5003語をダウンロードすることができる。
これに手を加えて、iPhone用のフラッシュカードアプリ『Flashcards Deluxe』で勉強できる様にしようというわけだ。
ダウンロードしたエクセルのデータ列を並び替え、左から中国語、ピンイン、日本語訳、英語訳、HSKの級数のデータが並ぶようにすればいい。

ダウンロードしたデータには日本語訳は含まれていないので、北辞郎のデータを利用することを考えた。
北辞郎には、中国語を変数として呼び出すとXML形式で日本語訳を取得することができるAPIが用意されているのだが、余分な物が付いてきて面倒だ。
北辞郎の管理人であるctrans氏に、彼が中日翻訳の為に作成したWindows版エディタであるPinconvで何とかならないか相談したところ、有り難くも中国語から日本語訳を取得するPinconv用のプラグインを提供して下さった。
実はこのPinconvというエディタは、漢字からピンイン、簡体字から日本の漢字、簡体字から繁体字などに変換することのできる、とても便利なツールである。
早速ユーザ登録料をPaypalでお支払いした。登録ユーザの特典として、このプラグインが有効化する様になれば良いと思うのだが。
日本語訳を取得する為には、まずA列にある中国語の単語を100個程コピーし、上記のプラグインをインストールしたPinconv上に貼り付ける。

プラグインを実行すると、新しい タブに北辞郎の日本語訳が表示されるので、それをコピーしてエクセル上のC列に貼り付ける。

一度に日本語訳を取得できるのはメモリ等の関係で100〜150単語程度だったので、何度もこれを繰り返した。
こちらは好みになるが、B列のピンインデータは数字で声調を表す形式だったので、普段見慣れた声調符号で表す形式に変換した。
この作業もPinconvの基本機能が力を発揮する。5003語の数字付きピンインをPinconvにコピーして、語と語の間のスペースを置換機能で取り除き、『convert』→『声調』で一気に声調符号付きピンインに変換してからExcelに書き戻す。
実はこれで終わりと言う訳にはいかない。
北辞郎から取得した日本語訳には、使用頻度の低い異読字の訳も含まれている。一つの漢字で複数の読みがある場合だ。
新HSKの勉強の為には必要ないので、D列の英語訳を参考にしながら、基本となる日本語訳だけを残して後は削除する。
更に、北辞郎のデータ上とFlashcards Deluxeのデータ上では、改行コードが異なるので、これもExcel上で置換した。
必修の5003語の内、67語は北辞郎では未登録であったので、自分で辞書を引いて登録した。勿論北辞郎にも登録した。その多くは日本語でも中国語と同じ漢字を使う見慣れた単語だった。
北辞郎のデータの中にはフォーマットが正しくないものが20語ほどあったので、こちらも修正しておいた。
こうしてできあがったExcelデータがこれだ。

これをクラウド経由でiPhone上のFlashcards Deluxeに読み込ませる。
Flashcards Deluxe 
カテゴリ: 教育
価格: ¥450





はじめまして。
私も現在hsk対策用に単語帳をつくっているところで、とっても参考になりました。ありがとうございます。
Pincovのプラグイン素晴らしいですね!申請してみようかしら。
こんばんは。はじめまして。
私もflashcardsで中国語単語帳を作ってますが、
大変参考になりありがとうございます。
ただ、Pincovのプラグイン申請のところが
よくわかりません。
どのようにすればいいか、
よろしくご教授いただけませんでしょうか。
不躾で失礼いたします。