HOME > Category : 言葉 > にほんごのむずかしさ
« 最近気になっていること | テレビで中国語 26(都) »

にほんごのむずかしさ

 
名古屋大学で楽しそうなツールが公開されていました。

日本語テキストの難易度を測る
http://kotoba.nuee.nagoya-u.ac.jp/sc/readability/
(via. 日本語テキストの難易度推定ツール『帯 1.x (obi-one)』)
帯(obi)は、日本語のテキストの難易度(リーダビリティ)を推定するプログラムです。(中略)
難易度の規準には、小中高大の教科書127冊から抽出した1478サンプル、約100万字のコーパス(教科書コーパス)を用いています。
プログラムは、まず、それぞれの難易度に対する尤度を、文字の生起確率(文字のunigram)に基づいて計算します。得られた尤度のうち、最大の尤度をとる難易度が、求める難易度となります。


大学の教科書って何を使ってるんだろう。各学部から万遍なくとってきてるのかな。ちなみにうちのサイトのエントリをいくつか測定してみたら、だいたい9〜10(中3〜高1)ぐらいのレベルでした。

難易度の推定結果
Lacrime


念のため、今勉強で読んでるテキストを入れてみると…

難易度の推定結果
サンプル

13 (大学・一般) レベルでした。主観的には17ぐらいな気分なんですけど!5回読んでもわかりません!

2008年05月01日 [言葉] by スオミ - No Trackbacks このエントリーを含むはてなブックマーク このエントリーをはてなブックマークに追加 584

スポンサードリンク


コメント

No comments yet

コメントを追加

* コメントにURLを書くとブロックされます。
 (私が気付いたときは解除されることもありますが。)
* スパムブロックのため、コメントの反映に時間がかかることがあります。




TrackBack


* 現在、当方へのリンクがないTBは受け付けておりません。
* 当方へのTBの一覧のリンクはリダイレクトされています。SEO目的のみのTBはあまり意味をなさないと思いますのでご遠慮ください。




この記事へのトラックバックurl:http://www.lacrime.net/action.php?action=plugin&name=TrackBack&tb_id=2420 (右クリックでショートカットのコピーをご利用ください)