Skip to content

类似 目标识别(mu'biao'zhi'bie) 这种 边缘用例(注音非常用),看起来是按照 目'标识'别 这样分段注音形成的 #344

@githcx

Description

@githcx

from pypinyin import pinyin, load_phrases_dict, Style
result = pinyin("目标识别", style=Style.TONE)
print(result) # 输出: [['mu4'], ['biao1'], ['shi2'], ['bie2']]
[['mù'], ['biāo'], ['zhì'], ['bié']]

类似 目标识别(mu'biao'zhi'bie) 这种 边缘用例(注音非常用),看起来是按照 目'标识'别 这样分段注音形成的
显然 在默认词表里 标识 读音是 biao'zhi

而 目标识别 作为整体的词条,在多数上下文里会被注音成 mu'biao'shi'bie (但某些句子里,不排除当前的zhi的读音可行)

如果需要将注音的输入(如 目标识别)当作高频词来给出注音,除了收录词条(官方),提供自定义注音词表(小白用户不友好)。

官方能否作为一个问题,适当优化?谢谢。

p.s. 这是公司同事真实项目开发中发现的 badcase,代表了一部分真实的用户需求。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions