« 紀伊國屋に文具は売っていないのか? | メイン | 目聡い話ではなかった »

2009年1月12日

「寡額」を「かひたい」と読んだりするものの・・・・

数日前に、条文素読を音声ブラウザで機械化できないかということを検討しているという記事を書きましたが、いろいろ調べて、一応できそうな方法を見つけました。

ネックになっていたのが、音声合成の仕組みをマイクロソフトのSAPI4.0に頼っているという点だったのですが、フリーソフトで、自前の音声合成の仕組みを同梱しているのを見つけました。→「SofTalk

SofTalkは音声ブラウザではなく、テキスト読み上げソフトなので、「法令データ提供システム」からコピペする必要がありますが、これを使うと音声合成に加えて、合成した音声をWAVEファイルで保存できるので、再利用が可能ということになり、かなり便利かもしれません。

ただ、同梱されている音声合成が、システムを軽くするために、辞書がお粗末なのが難点でして、例えば「日本国民」を「にほんくにたみ」と読んだり、「寡額」を「かひたい」と読んだりするので、条文のデータをテキストファイルでローカルに保存した上で、そのテキストをSofTalkに入力して一度流し聴きして、読み間違ったところをテキストエディタで修正したものを用意するのがいいかと思います。

例として、憲法前文を音声合成したWAVEファイルををMP3に変換したのをアップしておきます。

kenpou00.mp3

MP3にするとちょっと割れてしまってイマイチですが、元々のWAVEファイルは、まあまあの音質。棒読み調なのは仕方ないですがね。

で、ここまで読み間違いなく読ませるには、以下のようにテキストを修正する必要がありました(傍線部が修正部分)。

日本こく憲法
(昭和二十一年十一がつみっか 憲法)

  日本こくみんは、正当に選挙された国会における代表しゃを通じて行動し、われらとわれらの子孫のために、諸国みんとの協和による成果と、わが国全土にわたて自由のもたらすけいたくを確保し、政府の行為によて再び戦争の惨禍が起ることのないようにすることを決意し、ここに主権がこくみんに存することを宣言し、この憲法を確定する。そもそも国政は、こくみんの厳粛な信託によるものであって、その権威はこくみんに由来し、その権力はこくみんの代表しゃがこれを行使し、その福利はこくみんがこれを享受する。これは人類普遍の原理であり、この憲法は、かかる原理に基づくものである。われらは、これに反する一切の憲法、法令及び詔勅を排除する。
 日本こくみんは、恒久の平和を念願し、人間相互の関係を支配する崇高な理想を深く自覚するのであて、平和を愛するしょこくみんの公正としんぎに信頼して、われらの安全と生存を保持しようと決意した。われらは、平和を維持し、専制と隷従、圧迫と偏狭を地上から永遠に除去しようと努めてる国際社会において、名誉ある地位を占めたいと思。われらは、全世界のこくみんが、ひとしく恐怖と欠乏からまぬかれ、平和のうちに生存する権利を有することを確認する。
 われらは、いづれの国家も、自国のことのみに専念して他国を無視してならないのであって、政治道徳の法則は、普遍的なものであり、この法則に従うこと、自国の主権を維持し、他国と対等関係に立うとする各国の責務であると信ずる。
 日本こくみんは、国家の名誉にかけ、全力をあげてこの崇高な理想と目的を達成することを誓

結構直していますが、検索・置換してやればそんなに手間ではありません。

トラックバック

このエントリーのトラックバックURL:
http://www.rigorist.net/weblog/mt-tb.cgi/1437

このサイトのフィードを取得



Powered by Movable Type 4.25
Movable Type 4.25

Valid XHTML 1.0 Transitional