rhoknp.units.sentence module¶
- class rhoknp.units.sentence.Sentence(text: str | None = None)[source]¶
Bases:
Unit文クラス.
- Parameters:
text – 文の文字列.
- EOS = 'EOS'¶
- SID_PAT = re.compile('^(?P<sid>(?P<did>[a-zA-Z\\d\\-_]*?)-?\\d*)$')¶
- SID_PAT_KWDLC = re.compile('^(?P<sid>(?P<did>w\\d{6}-\\d{10})(-\\d+){1,2})$')¶
- SID_PAT_WAC = re.compile('^(?P<sid>(?P<did>wiki\\d{8})(-\\d{2})(-\\d{2})?)$')¶
- index¶
文書全体におけるインデックス.
- property global_index: int¶
文書全体におけるインデックス.
- property did: str¶
文書 ID(doc_id のエイリアス).
- property sid: str¶
文 ID(sent_id のエイリアス).
- property base_phrases: list[BasePhrase]¶
基本句のリスト.
- Raises:
AttributeError – 解析結果にアクセスできない場合.
- property comment: str¶
コメント行.
- classmethod from_raw_text(text: str, post_init: bool = True) Sentence[source]¶
文クラスのインスタンスを文の文字列から初期化.
- Parameters:
text – 文の文字列.
post_init – インスタンス作成後の追加処理を行うなら True.
Example
>>> from rhoknp import Sentence >>> text = "天気が良かったので散歩した。" >>> sent = Sentence(text)
- classmethod from_jumanpp(jumanpp_text: str, post_init: bool = True) Sentence[source]¶
文クラスのインスタンスを Juman++ の解析結果から初期化.
- Parameters:
jumanpp_text – Juman++ の解析結果.
post_init – インスタンス作成後の追加処理を行うなら True.
- Raises:
ValueError – 解析結果読み込み中にエラーが発生した場合.
Example
>>> from rhoknp import Sentence >>> jumanpp_text = """ ... # S-ID:1 ... 天気 てんき 天気 名詞 6 普通名詞 1 * 0 * 0 "代表表記:天気/てんき カテゴリ:抽象物" ... が が が 助詞 9 格助詞 1 * 0 * 0 NIL ... 良かった よかった 良い 形容詞 3 * 0 イ形容詞アウオ段 18 タ形 8 "代表表記:良い/よい 反義:形容詞:悪い/わるい" ... ので ので のだ 助動詞 5 * 0 ナ形容詞 21 ダ列タ系連用テ形 12 NIL ... 散歩 さんぽ 散歩 名詞 6 サ変名詞 2 * 0 * 0 "代表表記:散歩/さんぽ ドメイン:レクリエーション カテゴリ:抽象物" ... した した する 動詞 2 * 0 サ変動詞 16 タ形 10 "代表表記:する/する 自他動詞:自:成る/なる 付属動詞候補(基本)" ... 。 。 。 特殊 1 句点 1 * 0 * 0 NIL ... EOS ... """ >>> sent = Sentence.from_jumanpp(jumanpp_text)
- classmethod from_knp(knp_text: str, post_init: bool = True) Sentence[source]¶
文クラスのインスタンスを KNP の解析結果から初期化.
- Parameters:
knp_text – KNP の解析結果.
post_init – インスタンス作成後の追加処理を行うなら True.
- Raises:
ValueError – 解析結果読み込み中にエラーが発生した場合.
Example
>>> from rhoknp import Sentence >>> knp_text = """ ... # S-ID:1 ... * 1D ... + 1D ... 天気 てんき 天気 名詞 6 普通名詞 1 * 0 * 0 "代表表記:天気/てんき カテゴリ:抽象物" ... が が が 助詞 9 格助詞 1 * 0 * 0 NIL ... * 2D ... + 2D <節-区切><節-主辞> ... 良かった よかった 良い 形容詞 3 * 0 イ形容詞アウオ段 18 タ形 8 "代表表記:良い/よい 反義:形容詞:悪い/わるい" ... ので ので のだ 助動詞 5 * 0 ナ形容詞 21 ダ列タ系連用テ形 12 NIL ... * -1D ... + -1D <節-区切><節-主辞> ... 散歩 さんぽ 散歩 名詞 6 サ変名詞 2 * 0 * 0 "代表表記:散歩/さんぽ ドメイン:レクリエーション カテゴリ:抽象物" ... した した する 動詞 2 * 0 サ変動詞 16 タ形 10 "代表表記:する/する 自他動詞:自:成る/なる 付属動詞候補(基本)" ... 。 。 。 特殊 1 句点 1 * 0 * 0 NIL ... EOS ... """ >>> sent = Sentence.from_knp(knp_text)