ASCII24 Top ASCII24 News ASCII24 Review ASCII24 Business Center 携帯24 Mac24 Akiba2GO! デジタル用語辞典 ASCII24 Broadband Center 最新ニュース バックナンバー イベント情報 ASCII24 Top ASCII24 News ASCII24 Review ASCII24 Business Center 携帯24 Mac24 Akiba2GO! デジタル用語辞典 ASCII24 Broadband Center 最新ニュース バックナンバー ASCII24メールサービス blogmag
ASCII24 - [Main Menu] [Menu 2]


  ASCII24 > ニュース > テクノロジー/デバイス
111
記事/用語/ID検索 

最新ニュース
【速報】 待望のiPod shuffleが発売!Apple Storeで実機が触れる(from Mac 24)(2006年11月3日)
【速報】 アップル、 “ホームオーディオを再発見” がテーマのiPod用スピーカー 『iPod Hi-Fi』 を発表――同時にケース2製品も登場(from Mac 24)(2006年3月1日)
【速報】 第3の “Intel Mac” はMac miniだった!――LAN経由で音楽やビデオを配信できる新しい “Front Row” を採用(from Mac 24)(2006年3月1日)
“4倍速い” は本当だった!? ウワサのIntel Macを速攻レビュー(from Mac 24)(2006年2月23日)
アップル、 iPod nanoの1GBモデルを1万7800円で発表――iPod shuffleの価格も改定(from Mac 24)(2006年2月7日)
SARS (重症急性呼吸器症候群) の影響で “Computex Taipei 2003” が延期に!(from Akiba2GO!)(2003年4月30日)
FSBは800MHzの時代へ!Pentium 4-3GHzがアキバで販売開始!(from Akiba2GO!)(2003年4月14日)
NTTグループ、 FOMAとパソコンでのテレビ電話を実現するプラットフォームを発表(from 携帯24)(2003年1月28日)
【集中連載特集・OracleWorld 2002】 “OracleWorld 2002” スペシャルレポート from San Francisco(from ASCII24 Business Center)(2002年11月11日)
アドミラルシステム 『HotBiz』 メーカーインタビュー―― 「ASPにより、 わかりやすく、 運用しやすく、 導入しやすいグループウェアを」 (from ASCII24 Business Center)(2002年8月13日)
「スーパークリエイター=ハッカー」 の世界 - 『ITX 2002 Summer』 レポート(from 日刊アスキー Linux)(2002年6月29日)
【速報】 Netscape最新版公開!! バージョンは7.0! (PR1) (from 日刊アスキー Linux)(2002年5月23日)
JavaOneレポート(from ASCII24 Business Center)(2002年3月29日)
音楽フリーソフトウェアのためのライセンス 「OCPL」 の評価版公開(from 日刊アスキー Linux)(2002年3月5日)
コンパック、 Webサーバアプライアンス 『Compaq TaskSmart W2200』 を発表(from 日刊アスキー Linux)(2001年12月13日)

今週の特集

特集
COMPUTEX TAIPEI 2006レポート
Interop Tokyo 2006レポート
CeBIT 2006レポート
IDF 2006レポート

コラム
過去の記事一覧






Contact Information

[PR]
Printable Version ニュース / テクノロジー/デバイス

NTT、『日本語語彙大系』CD-ROM版と文章解析プログラムを完成


1999年9月27日

日本電信電話(株)は24日、日英翻訳システムの研究成果として、大規模な日本語単語の意味の違いを体系化した意味辞書『日本語語彙大系』CD-ROM版を完成し、同辞書の体系を用いて日本語の文章を解析する形態素解析プログラム『ALTJAWS(アルトジョーズ)』を開発したと発表した。同プログラムは、大学/研究機関での研究目的に限り、無償で提供する。

コンピューターに言葉を記録させる場合、その語句がどうのような状況で使用できるかを判断するのに曖昧さが生じることがある。このような曖昧さを解消し、コンピューターによる日本語の解析精度を向上させるために、NTTコミュニケーション科学基礎研究所ではコンピューターが直接扱うことができる言語知識ベースの構築とそれを用いた日本語解析プログラムの研究を進めてきたという。

今回完成した同辞書は、'97年9月に岩波書店から出版された『日本語語彙大系(全五巻)』に、検索機能を組み込んだ、EPWING規約準拠の電子辞書。3つの体系から構成されている。“意味体系”として、日本語の一般名詞、固有名詞、用言の意味の用法をツリー構造で3000カテゴリー、最も深いレベルで12段に体系化。“ 単語体系”として、30万語の単語を意味体系によって定義。“構文体系”として、6000の用言(動詞や形容詞)に対して、主語/目的語にくる名詞を意味体系で定義し、対応する英語構文を収録。1万4000パターンの辞書を構築している。例えば“取る”という動詞に対して、“ホテルを取る”は“reserve”、“使用料を取る”は“charge”というように、目的語になりうる名詞を、意味カテゴリーを用いて表現することで、構文の意味の違いを示す。また、“動詞と助詞の組み合わせが自然かどうか”を調べることも可能。

同プログラムは、日本語の文章を入力すると、単語単位に区切り、品詞を決定し、同意味辞書の体系に基づく意味情報をコードで出力するプログラム。実用的な語彙規模で体系化した同辞書のうち、意味体系と単語体系を実装することで、固有名詞などが多く出てくる新聞記事においても、精度よく単語に分割できるという。

解析のプロセスは、 日本文の入力→形態素(単語や接辞)の検索と候補の抽出→文法的に接続可能な候補をつないで候補列の作成→単語の品詞や意味カテゴリーなどを用いて意味的な係り受けの有無のチェック→分割数が少なく、係り受け数の多い候補を最終候補に決定→形態素の単位と品詞情報と意味カテゴリーの出力。このように、単語間の接続条件や係り受けを自動的に調べて、正しいと想定される候補を抽出する。

(編集部)


この記事が関連していると思われます


関連記事の検索には汎用連想計算エンジン(GETA)を利用しています。
「汎用連想計算エンジン(GETA)」は、情報処理振興事業協会(IPA)が実施した「独創的情報技術育成事業」の研究成果です。



ASCII24 RealEstate
advertisement



Copyright (C) 1997-2008 ASCII MEDIA WORKS. All Rights Reserved.
No portion of this web site may be reproduced or duplicated without the express written permission of ASCII MEDIA WORKS Inc.
This web site is written in Japanese only.
記事に関するご意見やご質問は、お問い合わせフォームにてお送りください