MBS 毎日放送

ミント! ミント!

毎週月~金曜日 ごご3:49~放送関西のニュースは毎週月~金曜日 ごご4:30~放送

ミント!

難解な「くずし字」がAIでサクサク読める!読まれないままの文献多く"予想外の事実"見つかる可能性も

2019年12月10日(火)放送

SHARE
Twitter
Facebook
はてなブログ
LINE

平安時代から1000年以上使われてきた「くずし字」。現在、読み解くことが出来る人は数千人しかいないとも言われています。この難解な「くずし字」の文献をAIの力で“サクサク読める”システムを立命館大学などが開発しました。埋もれている史料から、まだまだ知らない日本の真の姿が見えてくるかもしれません。

立命館大学が開発“くずし字を読み解くシステム”

京都市北区にある「立命館大学アート・リサーチセンター」にやって来たMBSの辻憲太郎解説委員。文学部の赤間亮教授らの研究チームは、AIの支援を受けながら“くずし字を読み解くシステム”を開発しました。どのようなものなのか教えてもらう前に、辻解説委員が自力でくずし字の解読に挑戦です。
1aa.jpg
 (赤間教授)「読めなかったら言って下さいね。読めなかったところからがAIの仕事。」
(辻解説委員)「『一つ』…もう無理です。」
1b.jpg
辻解説委員が解読に挑戦したのは、1831年(天保2年)の歌舞伎の台本です。このシステムは、読めなかった文字を抜き出すと、AIが自動的に似ている文字をいくつかあげて、合致するパーセンテージと共に表示されます。
1c.jpg
辻解説委員が読めなかった一文をAIで解読すると…全く読めなかったくずし字が、『一つそしてたばこの火じゃ』という、意味が分かる文章に変換されました。

「(AIに)助けてもらえなければ、3文字目でつまずいて嫌になる。(AIの支援があると)どんどん読んでいけちゃうと。」(立命館大学・文学部 赤間亮教授)

「簡単に読める」ゲーム感覚で楽しむ学生

教育支援として開発されたこのシステムは、2019年4月から文学部の古典籍(明治頃以前の資料で価値があるもの)を学ぶ授業で導入されています。以前は、居眠りする学生も多かったということですが、今では…

(学生)「(くずし字を)ちゃんと読むことができなかったので、AIを使って読むと、ラクで楽しい。(システムを使っていると)あるタイミングで自分で読めるようになる。」
(学生)「ものすごく正確やなぁと思います。わかりやすくて。(Qおもしろい?)楽しいですね。(Qどんな物語ですか?)そこまで内容は…理解はあまり…。」

学生にとっては、ゲーム感覚で楽しめると、好評のようです。
2b.jpg
「身近に古文書とか(古い)作品を感じ取れる、良いツールができたなとは思っています。これによって何かやってもらいたい、というよりも前に入り口として『(くずし字が)こんなに簡単に読める』というところを体験してもらうのが一番大切だなと思っています。」(赤間亮教授)

ほぼ読まれず「思ってもみなかった事実見つかる可能性」

1000年以上使われてきたくずし字。この文字で書かれた文献は多く残っているものの、実はほとんど読まれていないのが実態だといいます。

「(Q読まれていない文献は沢山ある?)数は見当がつかない。(Q過去の日本の姿が克明に記されている書物が無数にある?)無数にある。思ってもみなかった事実が見つかる可能性はいくらでもある。」(赤間亮教授)

古い文献の修復・保存作業も進む

立命館大学では多くの古典籍などを所蔵しているほか、古い文献の修復作業も進めています。その現場を辻解説委員が訪れました。作業中の文献は穴だらけです。

 (辻解説委員)「この穴は?」
(作業中の女性)「虫食いのあと。(紙をはたくと)黒い糞が出てきますね、。だいぶはたいたのですが。」
 (辻解説委員)「修復すれば?」
(作業中の女性)「キレイになりますよ。」

江戸時代の文献の修復作業を見せていただきました。

虫の糞などでくっついてしまったページを手作業ではがし、ピンセットで縮れてしまった文字の部分を丁寧に伸ばすなどして修復します。最後に裏に和紙を貼り、乾かしたら完成。
4e'.jpg
修復された文献や書物は一枚一枚写真に収めて、デジタル保存され、将来読まれることになるその時を待ちます。

「わずか数秒で」くずし字文献の半ページ解読

AIを活用してくずし字を読み解こうという動きは全国に広がっています。2019年11月に東京・千代田区で開催された『日本文化とAIシンポジウム2019~AIがくずし字を読む時代がやってきた~』で、その最新の取り組みが発表されていました。

このシンポジウムを企画したのは、データサイエンス共同利用基盤施設・人文学オープンデータ共同利用センターの北本朝展さんです。北本さんは、立命館大学の赤間教授らとは別のくずし字解読ソフト「KuroNet(クロネット)」を開発していて、実際にパソコンの画面上で見せていただきました。
5c.jpg
「(読みたい部分を)囲みます。囲んで『クロネット』というくずし字認識サービスを呼び出します。そうすると(くずし字の隣に平仮名や漢字が出てくるので)読めたと。(Qもうできた?)はい。このパソコンシステムでは3秒ぐらいですけど、最新パソコンだと1秒で読めます。」(データサイエンス共同利用基盤施設・人文学オープンデータ共同利用センター 北本朝展さん)

半ページの解読にかかる時間はわずか数秒。こうした技術を使えば手つかずの文献をどんどん読み解いていくことが可能になります。また北本さんは今後は古文を現代文に“翻訳”するシステムの開発も視野に研究を行っているそうです。

くずし字の史料「重要な知恵が集まっている」

AIによって切り開かれようとしているくずし字の世界。そこには一体、何が書かれているのでしょうか。江戸文学に精通し、くずし字を読むことが得意な国文学研究資料館のロバート・キャンベル館長に聞いてみました。

「災害大国日本の中には、とても多くの経験と知恵、防災の知識が沢山積み上げられている。皆様のおじい様やおばあ様が大切に伝えてきた文字の史料。歴史社会を知る、地球・環境がどういう風に変わったか、災害が起きた時に社会がどういう風に再建されるのか、重要な知恵がそこに集まっているわけですね。それを開いていく、共有をしていく。そしてそれを資源として活用することですね。」(国文学研究資料館 ロバート・キャンベル館長)

(12月10日放送 MBSテレビ「ミント!」内『辻憲のちょいサキ!』より)

最近の記事

バックナンバー