忍者ブログ
Well come to computer world of TFCRA!!!

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。


这篇博文是关于将新版搜狗拼音词库导入谷歌拼音方法的研究。
  博主以前使用搜狗拼音,但是后来出于安全考虑,决定改投谷歌拼音。可是由于原来的个人词库使用非常顺手,突然换了输入法还没词库,真的很不舒服,于是上网查找,无奈有些软件适用于旧版搜狗拼音的导出词库,有些软件只能对网上的词库进行处理,所以只好自己想办法,将新词库转换为软件可识别的格式。
需要使用到的软件/相关技能:
  1. 一个可以转换文档编码和使用正则表达式查找文本的文本编辑器(Notepad++是个不错的选择)。官方网站:http://notepad-plus-plus.org/
  2. 需要了解正则表达式。
  3. 谷歌词典转换工具。这个软件是我从小众软件那个网站下载的,请移步至这里下载:http://www.appinn.com/googledicmaker/

基本的软件准备好以后,我们就可以开始了……
首先,我们在搜狗拼音中,将词库导出为TXT格式,如果不知道该如何导出请猛击这里
然后,我们打开导出的TXT文件,会看到:
汉字前面有拼音注音,且文档编码为USC2-LE。
Sogou to Google
而转换程序识别ANSI编码且汉字前面没有拼音,所以我们先将文档转化为ANSI格式:
Sogou to Google
接着按<Ctrl> +<F>进行查找替换,将汉字前面的拼音和那一个空格全部删除,使用正则表达式查找查找:
在查找(Find what)中写入:\'[\w\']+\s
替换为(Replace with)留空,并选择使用正则表达式查找,如下图所示:

按下右边的替换全部(Replace All)开始删除汉字前面的拼音,视导出词库中的词汇数目影响,替换时间会有所差异,在我的电脑上,这个操作用掉了大概90秒。
如果替换步骤成功,你将会看到这样的画面:(汉字前面的拼音全部消失了)
Sogou to Google
最后<Ctrl>+<S>保存劳动成果。
之后的操作就很简单了,将处理后的搜狗拼音词库使用转换器生成谷歌拼音的词库。导入谷歌拼音即可。
结束。
PR
Comment
name
title
color
mail
URL
comment
passward   Vodafone絵文字 i-mode絵文字 Ezweb絵文字
Trackback


Tfcra_Weblog
design&photo by [Aloeswood Shrine / 紅蓮 椿] ■ powerd by [忍者BLOG]
忍者ブログ [PR]
フリーエリア
=======================
在这里搜索成人资源 =^_^=
アダルトリソース検索 =^_^=
Search Adult Resources Here: =======================
Translate this page to your language:
=======================
=======================

=======================
=======================
free counters =======================
カレンダー
12 2025/01 02
S M T W T F S
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
ブログ内検索
バーコード
最新記事