from pypinyin import pinyin, load_phrases_dict, Style
result = pinyin("目标识别", style=Style.TONE)
print(result) # 输出: [['mu4'], ['biao1'], ['shi2'], ['bie2']]
[['mù'], ['biāo'], ['zhì'], ['bié']]
类似 目标识别(mu'biao'zhi'bie) 这种 边缘用例(注音非常用),看起来是按照 目'标识'别 这样分段注音形成的
显然 在默认词表里 标识 读音是 biao'zhi
而 目标识别 作为整体的词条,在多数上下文里会被注音成 mu'biao'shi'bie (但某些句子里,不排除当前的zhi的读音可行)
如果需要将注音的输入(如 目标识别)当作高频词来给出注音,除了收录词条(官方),提供自定义注音词表(小白用户不友好)。
官方能否作为一个问题,适当优化?谢谢。
p.s. 这是公司同事真实项目开发中发现的 badcase,代表了一部分真实的用户需求。