新しいアジア言語の単語をユーザー辞書に追加できますか?
環境:
アジア言語ー辞書
Analytics, Oracle B2C Service, 全バージョン
解決策:
アジア言語辞書ディレクトリには、品詞(POS)タグ付けおよび同様のフレーズ検索に使用される追加の辞書単語リストが含まれています。
特別なパラメータを使用してユーザー辞書ファイルに単語を追加すると、デフォルトのセグメンテーションを上書きできます。
ユーザー辞書ファイルは、中国語と日本語、特にマンダリン(user.dict_CN.utf8)、広東語(user.dict_HK.utf8)、台湾語(user.dict_TW.utf8)、および日本語(user.dict_JP.utf8)でのみ使用できます。
新しい単語、個人名、および他のアルファベットの字句付き文字を追加することによって、業界またはアプリケーションに固有の単語用のユーザー辞書を作成できます。 更に、既存の単語の分割方法を指定することもできます。 例えば、製品名が化合物であっても、製品名がセグメント化されないようにすることができます。 システムは、セグメント化を決定するために50万語以上の検索を実行する。 辞書、エイリアスリスト、およびキーワードを使用すると、単語の分割方法に影響を与えることができます。
ユーザー辞書ファイルを編集する場合は、特定の形式を使用する必要があります。 追加したい単語の後ろには、ユーザー辞書の品詞タグ(下記)と単語の文字数を指定する数字のカンマ区切りリスト形式のオプションの分解パターン(DecompPattern)が続きます 文字列の各要素に含める。 DecompPatternが必要でないことを示すには、ゼロ(0)を使用します。
マンダリン、広東語、台湾語のユーザー辞書POSタグ(大文字と小文字を区別しない)
- NOUN
- PROPER_NOUN
- PLACE
- PERSON
- ORGANIZATION
- FOREIGN_PERSON
日本語のユーザ辞書POSタグ(大文字小文字を区別しない)
- NOUN
- PROPER_NOUN
- PLACE
- PERSON
- ORGANIZATION
- GIVEN_NAME
- SURNAME
- FOREIGN_PLACE_NAME
- FOREIGN_GIVEN_NAME
- FOREIGN_SURNAME
注意:新しい単語をユーザー辞書へ追加/保存した状態では、まだユーザー辞書での変更は完全に反映されません。その状態であると、既存の単語での検索はヒットされますが、新しく追加された単語での検索はヒットされません。
反映させるには、弊社ホスティングチームによりKeywordindexerユーティリティを実行する必要があります。この実行をスケジュールするには、テクニカルサポートへまずはお問い合わせをご提出ください。
時差がございますため、お問い合わせをご提出されてから、作業が完了されるまでに数日かかることもございますことご了承ください。また、実行日時をスケジュール希望とされます場合、少なくともその実行希望日時の24時間前にはご依頼いただけますようお願い申し上げます。(ホリデーや週末をはさむ場合は、スケジュールのためにもう少し余分なお日にちをいただけますと幸いです。)
詳細情報は、現在ご利用のバージョンのオンライン・ドキュメンテーションにある 'アジア言語辞書' セクションをご覧ください。 Oracle B2C Service オンライン・ドキュメンテーション又はマニュアルにアクセスするには、Oracle B2C Serviceプロダクトのドキュメントをご覧ください。