查拼音和五笔编码的小工具

2024年2月10日12:46:06评论21 views字数 1886阅读6分17秒阅读模式

给大家推荐一个查拼音和五笔编码的小工具，项目地址：

https://github.com/hyang0/wubi

使用方法：

$ python wubi.py 百家姓.txt汉字: 赵钱孙李拼音: zhao qian sun li五笔: fhqi qgt biy sbf汉字: 周吴郑王拼音: zhou wu zheng wang五笔: mfkd kgdu udbh gggg

将需要查询的汉字批量存入文件中，传参给 wubi.py 即可。txt 文件编码要求是 utf-8 编码。它的工作原理是查询编码字典，根据字典将编码打印出来。

86版五笔编码字典文件为项目下的 wubi86.dict

$ head wubi86.dict工 aaa匞 aad式 aad苷 aaf芽 aah戒 aak苣 aan戔 aar荛 aat芅 aau

数据源来自 rime-wubi 项目，只保留了单字，去除了词语和成语：

https://github.com/rime/rime-wubi

脚本代码为：

import argparsefrom pypinyin import pinyin, Styleimport platformimport osimport sysdef change_default_encoding():    '''判断是否在 windows git-bash 下运行，是则使用 utf-8 编码'''    if platform.system() == 'Windows':        terminal = os.environ.get('TERM')        if terminal and 'xterm' in terminal:            sys.stdout.reconfigure(encoding='utf-8')def is_empty_line(line):    return line.isspace()def load_wubi_dict(file_path):    wubi_dict = {}    with open(file_path, 'r', encoding='utf-8') as file:        for line in file:            char, wubi_code = line.strip().split(' ')            wubi_dict[char] = wubi_code    return wubi_dictdef get_pinyin(character):    pinyin_result = pinyin(character, style=Style.NORMAL)    pinyin_str = ''.join([item[0] for item in pinyin_result])    return pinyin_strdef get_wubi(character, wubi_dict):    wubi_str = wubi_dict.get(character)    if not wubi_str:        return character    return wubi_strif __name__ == "__main__":    change_default_encoding()    parser = argparse.ArgumentParser(description="汉字拼音和五笔编码查询工具")    parser.add_argument("file_path", help="包含汉字的文件路径")    parser.add_argument("--wubi_file", default=r"wubi86.dict", help="五笔编码文件路径，默认为 wubi86.dict")    args = parser.parse_args()    wubi_dict = load_wubi_dict(args.wubi_file)    with open(args.file_path, 'r', encoding='utf-8') as file:        for line in file:            characters = line.strip()            if is_empty_line(line):                continue            py_list = []            wb_list = []            for char in characters:                pinyin_result = get_pinyin(char)                wubi_result = get_wubi(char, wubi_dict)                py_list.append(pinyin_result)                wb_list.append(wubi_result)            print("汉字:", characters)            print("拼音:", ' '.join(py_list))            print("五笔:", ' '.join(wb_list))            print()

全文完。

如果转发本文，文末务必注明：“转自微信公众号：生有可恋”。

原文始发于微信公众号（生有可恋）：查拼音和五笔编码的小工具

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

查拼音和五笔编码的小工具

T-Reqs：一款基于语法的HTTP漏洞挖掘工具

yakit向日葵远程命令执行检测插件

DetectionLabELK搭建及使用

BloodyAD：一款功能强大的活动目录提权框架

SharpDecryptPwd Source Code

黑客渗透测试领域的终极神器——Metasploit Framework (MSF)！

剑指HW｜一款基于GO的简易隧道

开源工具Kanister：数据保护工作流管理工具

安卓版CobaltStrike：远程控制的终极利器：moukthar

PassGuard是一个轻量级安全工具，专为防护Linux系统中的脏牛(Dirty COW)内核漏洞而设计。

发表评论

在线咨询

微信