株式会社ズー (本社:長野県上田市 代表取締役社長:宮島 仁一 www.zoo.co.jp)は、日本語処理技術(形態素解析、係り受け解析)を応用することにより、日本語情報収集能力を飛躍的に高めたWEBブラウザ「スマートブラウザ」を開発いたしました。
「スマートブラウザ」は、独自の高精度日本語形態素解析(※自然言語で書かれた文章を、言語で意味を持つ最小単位に分割する技術)エンジン「言語郎」による日本語の「分かち書き」をすることで、「ホットクリック」、「関連文書検索」、「要約」、「ルビ振り」、「単語出現頻度解析」そして「言語解析」といった、従来のブラウザにはない様々な便利な機能を実装した新型WEBブラウザです。
|
|
スマートブラウザの主な機能
|
|
1.ホットクリック機能
|
|
ホームページ上の文章を自動的に「分かち書き」にし、それぞれの単語や文節をキーワードとする「検索サイト」、「ショッピングサイト」、「辞書サイト」などへの検索が、キーボード入力なしに、ワンクリックで可能になる機能です。例えば、現在見ているホームページ上にユーザの欲しいアイテムのキーワードがあった場合、クリック一つで好みのショッピングサイトに飛び、指定したキーワードの検索結果を表示することができます。また、分からない単語を調べたい時には、辞書サイトや翻訳サイトに飛び、その結果を表示することができます。高齢者の方やパソコンの初心者など文字をうまくタイプできない方でも、簡単に検索を行うことを可能にしたり、ショッピングサイトで目的のアイテムを探すことができます。
|
|
2.関連文書検索機能
|
|
単語出現頻度解析機能によって抽出された重要なキーワードで検索を行うことにより、現在見ているホームページの関連ページを即座に、かつ、より文意の近い文書を検索することが可能です。
|
|
3.自動要約機能
|
|
単語出現頻度解析結果による頻度の高い単語を含む文章を、要約率や対象を指定して、要約文として抽出することができます。
|
|
4.ルビ振り機能
|
|
形態素解析エンジン「言語郎」は51万語の単語辞書を持っており、その中に、「読み」、「発音」、「アクセント」の情報を持っています。ホームページのイメージを壊すことなく瞬時にルビを表示することが可能です。また、形態素解析による正確な単語識別により、三本(さんぼん)・三日(みっか)のような読み分けを実現しています。
|
|
5.言語解析機能
|
|
言語処理技術により、ホームページ上の日本語文章解析を行うことができます。単語単位への分割を行う「形態素解析」、文節単位への分割を行う「文節解析」、また、文節がどこに係っているか、その関係が連用修飾なのか連体修飾なのか、といった文節同士の関係性を調べる「係り受け解析」を行うことができます。
|
|
形態素解析エンジン「言語郎」の特長
|
|
【最高水準の単語抽出性能】
|
|
現状の業界最高水準であり、限界性能と言える正解率。新聞記事のような硬い文章では、平均98%以上の正解率を誇ります。
|
|
【最高速レベルの形態素解析速度】
|
|
従来のように高価で高速なサーバー機でなくとも、一般的なパソコンで十分高速な処理が可能です。
現在の一般的なパソコン(Pentium®M 1.73GHz、RAM 1GB)で、1秒当たり約48,000文字(全角文字)の形態素解析が可能です。
|
|
【独自開発による高度な言語解析アルゴリズム】
|
|
弊社が独自に開発した高度な言語解析アルゴリズムを採用しています。
700種類以上もの品詞種類に分けた、きめ細やかな品詞判別テーブルにより、微妙な日本語表現においても正確な形態素解析を可能としています。
|
|
【豊富な単語数の基本辞書】
|
|
辞書単語数は約51万語。専門語、複合語の追加により、より専門分野に特化した文書の正確な形態素解析が可能です。ユーザーが新語登録できるユーザー辞書機能もあり、追加することでユーザー辞書の単語が優先的に使用されます。
|
|
【対象の文章長は無制限】
|
|
入力する文字列の長さに制限はありません。基本的にはメモリ領域が許す限り、いかなる大きさの文章にも対応できます。
|
|
【様々なタイプの言語解析が可能】
|
|
形態素解析のみでなく、構文解析(係り受け解析)、単語出現頻度解析(名詞、動詞などの品詞別に17種類の解析が可能)、関連文書検索解析(単語出現頻度解析を利用して、関連文書検索のクエリーを作成可能)、自動要約機能、ルビ、発音ルビ、読み、発音の自動生成機能など、様々な機能を盛り込んでいます。
|
|
【各種OS対応形式でご提供可能】
|
|
Windows®ならDLL形式で、UNIXならライブラリ形式で提供することが可能です。
|