rhoknp.props.feature module

class rhoknp.props.feature.FeatureDict[source]

Bases: dict[str, str | bool]

文節,基本句,形態素の素性情報を表すクラス.

IGNORE_TAG_PREFIXES: ClassVar[set[str]] = {'memo ', 'rel '}
PAT: ClassVar[Pattern] = re.compile('(?P<feats>(<(?P<key>([^:\\"]|\\"[^\\"]*?\\")+?)(:(?P<value>([^>\\\\]|\\\\>?)+))?>)*)')
FEATURE_PAT: ClassVar[Pattern] = re.compile('<(?!(memo |rel ))(?P<key>([^:\\"]|\\"[^\\"]*?\\")+?)(:(?P<value>([^>\\\\]|\\\\>?)+))?>')
classmethod from_fstring(fstring: str) FeatureDict[source]

素性文字列をパースして辞書型に変換する.

例:”<正規化代表表記:遅れる/おくれる>” -> {“正規化代表表記”: “遅れる/おくれる”}

Parameters:

fstring – KNP 形式における素性文字列.

to_fstring() str[source]

素性文字列に変換.