帯(obi)は、日本語のテキストの難易度(リーダビリティ)を推定するプログラムです。(中略)
難易度の規準には、小中高大の教科書127冊から抽出した1478サンプル、約100万字のコーパス(教科書コーパス)を用いています。
プログラムは、まず、それぞれの難易度に対する尤度を、文字の生起確率(文字のunigram)に基づいて計算します。得られた尤度のうち、最大の尤度をとる難易度が、求める難易度となります。


* コメントにURLを書くとブロックされます。
(私が気付いたときは解除されることもありますが。)
* スパムブロックのため、コメントの反映に時間がかかることがあります。