認識辞書構造

構文

認識辞書仕様・制限

日本語

英語、その他欧州言語

単語番号

半角英数字4桁(1~9999)まで、数字の後ろは“:”(ASCII 0x3A)

単語表記
  • Shift-JIS全角カタカナ(0x8340~0x8394)、長音記号「ー」(0x815B)
  • 1単語あたり128Bまで
  • 半角アルファベット(ASCII)と一部記号「'」、「-」(ハイフン)、「 」(空白)
  • 空白で複数単語を連結可能
  • 単語最大文字数は32B、1表記あたりは128B
認識辞書

100単語(文章)、単語表記部分のみで合計1000バイト程度



中国語

韓国語

単語番号

半角英数字4桁(1~9999)まで、数字の後ろは“:”(ASCII 0x3A)

単語表記
  • GB2312-80
  • 1単語あたり128Bまで
  • CP949
  • 1単語あたりは128Bまで
認識辞書

100単語(文章)、単語表記部分のみで合計1000バイト程度



ロシア語

単語番号

半角英数字4桁(1~9999)まで、数字の後ろは“:”(ASCII 0x3A)

単語表記
  • ISO 8859-5 と「-」(ハイフン)、「 」(空白)
認識辞書

100単語(文章)、単語表記部分のみで合計1000バイト程度

説明

音声認識を行う前に、必ず「認識辞書」を用いて認識対象単語(文章)を登録します。
認識辞書はテキストで構成されるので、アプリケーション中で自由に内容を変更することができます。

音声認識ライブラリでは、単語表記の代わりに「発音記号」を入力することができます。
発音記号入力の詳細については、プログラミングガイド(外部仕様書編)を参照してください。

履歴

2014/05/28
初版