« 2008-04 | 2008-06 »

5月 1日 (木)

にほんごのむずかしさ


名古屋大学で楽しそうなツールが公開されていました。

日本語テキストの難易度を測る
http://kotoba.nuee.nagoya-u.ac.jp/sc/readability/
(via. 日本語テキストの難易度推定ツール『帯 1.x (obi-one)』)
帯(obi)は、日本語のテキストの難易度(リーダビリティ)を推定するプログラムです。(中略)
難易度の規準には、小中高大の教科書127冊から抽出した1478サンプル、約100万字のコーパス(教科書コーパス)を用いています。
プログラムは、まず、それぞれの難易度に対する尤度を、文字の生起確率(文字のunigram)に基づいて計算します。得られた尤度のうち、最大の尤度をとる難易度が、求める難易度となります。

[...続きを読む]
23時09分38秒 [言葉] - by スオミ - No comments - No Trackbacks このエントリーを含むはてなブックマーク このエントリーをはてなブックマークに追加

スポンサードリンク