忍者ブログ
Well come to computer world of TFCRA!!!

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。


   昨天我同学的电脑出了点小问题,大概就是每次连上网,就会启动Labview的安装程序,不过我也没在他的电脑边上,具体是怎么回事儿不太清楚……不过有一点可以确定,这个症状就像是同时安装了Office 2003和Office 2007以后,启动任意一个都会出现安装程序(仅限Windows Installer安装包)。
    最开始,我以为是卸载的时候,没有把注册表相关的项目删除造成的,就推荐清理了一下注册表和垃圾文件,没想到重启之后问题依旧,而且在控制面板里也找不到相关的程序供卸载……
    当时我的汗就下来了……这货不解决真的是非常蛋疼……抱着试试看的心理,在谷歌上随便搜索:Windows Installer Clean,出来一些联想结果,其中:Windows Installer CleanUp Utility 就比较靠谱。
    下载后,发现正是解决该问题的方法,把文件传给同学,安装……然后果断发现N个Labview安装包未卸载,Remove以后,一切都安静了,问题解决。
PR

  以前在无聊的时候,偶尔会从网上下载点恐怖小说寻求一下刺激。自从第一次下载阅读开始,就一直 有一件事令我感到非常的恶心:小说网站的站长为了让读者能够记住自己的网站地址,会在txt或者其他格式的文档里,重复不断的写进自己的网站域名和网站名称,我个人认为这就是在做广告。(当然了,也可能是站长为了防止自己辛苦收集的文字被别的网站轻易转载,而做的手脚),这里就以www.uutxt.com为例,请看下图:
去除小说垃圾信息(广告) 正则表达式
怎么样,是不是觉得特别恶心?

作为读者,看到文章里有这种东西,那是多么的影响心情啊……
因为我比较喜欢免费且免注册的下载网站,而这个uutxt正好符合我的喜好,所以我经常从这里下载小说看。不过就像刚才我说的,我觉得这种做法非常恶心,所以我要调教它一下……


废话不多说,现在就开始,让我们再来看这幅图:
去除小说垃圾信息(广告) 正则表达式
我们来寻找一下这些文字的规律:
  1. 最容易第一眼看到的,也是最直观的,字母有大小写,还有全角和半角字符。
  2. 字符的格式相对比较整齐。(我个人判断是使用某些自动化的程序完成的,处理文字的人只要设置好固定位置的字符范围,随机生成即可)
  3. 每一段的字符总长度都是一样的。
所以综上所述,我们就确定了基本的思路:使用正则表达式对其进行垃圾信息查找,并使用空字符进行替换。在这里,推荐一款正则表达式测试软件:RegEx Tester 它的使用非常简单,GUI上面只有三个方框,第一个用来输入正则表达式,第二个用来输入需要进行匹配的文本,第三个用来显示匹配结果。上面的图就是截取的匹配结果。

那么我们开始进行正则表达式书写,首先,我们先匹配字母形式的网址:
[UuUu]+[TtTt][XxXx][TtTt][\.\.\。][cCCc][OoOo][MmMm]
我们在图中可以看到,字母有大小写和全、半角,而那个点,也有半角、全角以及用句号代替,三种写法。所以使用上面的正则表达式进行匹配比较合适。为什么要如此花时间在这些英文字符上呢?因为这些垃圾信息的格式相对比较整齐,所以,只要准确的定位了这些英文字符,就能更简单的处理汉字字符了。


把从uutxt.com下载的小说txt打开,全选,粘贴到RegEx Tester的第二个方框中,复制上面的正则表达式到第一个方框中,按下<F5>,可以看到,所有的网址都已经匹配完毕:
匹配网址
网址匹配好以后,我们就可以开始继续观察,网址的字符串,和它前后的汉字之间,有一个空格。那么我们再试:
\s[UuUu]+[TtTt][XxXx][TtTt][\.\.\。][cCCc][OoOo][MmMm]\s
之后你会看到:

匹配空格加网址
感觉好像和上一幅图一样?其实字符串前后的空格已经被匹配上了,注意看首字母和Match的相对位置。

再进一步观察,字符串前面的空格前,有4个汉字,字符串后面的空格后面,有6个汉字。那么我们就再进一步:
.{4}\s[UuUu]+[TtTt][XxXx][TtTt][\.\.\。][cCCc][OoOo][MmMm]\s.{6}

这时候,就可以匹配到全部的垃圾信息,你可以看到和第一幅图一样的情况,这条正则表达式就完成了,接下来,我们只要把那些文字替换掉就好,也许你需要Regex Buddy这样的软件来完成替换工作。不过那已经不重要了,前面正则表达式的编写思路才是最重要的。
使用Regex Buddy替换垃圾信息广告

这篇博文是关于将新版搜狗拼音词库导入谷歌拼音方法的研究。
  博主以前使用搜狗拼音,但是后来出于安全考虑,决定改投谷歌拼音。可是由于原来的个人词库使用非常顺手,突然换了输入法还没词库,真的很不舒服,于是上网查找,无奈有些软件适用于旧版搜狗拼音的导出词库,有些软件只能对网上的词库进行处理,所以只好自己想办法,将新词库转换为软件可识别的格式。
需要使用到的软件/相关技能:
  1. 一个可以转换文档编码和使用正则表达式查找文本的文本编辑器(Notepad++是个不错的选择)。官方网站:http://notepad-plus-plus.org/
  2. 需要了解正则表达式。
  3. 谷歌词典转换工具。这个软件是我从小众软件那个网站下载的,请移步至这里下载:http://www.appinn.com/googledicmaker/

基本的软件准备好以后,我们就可以开始了……
首先,我们在搜狗拼音中,将词库导出为TXT格式,如果不知道该如何导出请猛击这里
然后,我们打开导出的TXT文件,会看到:
汉字前面有拼音注音,且文档编码为USC2-LE。
Sogou to Google
而转换程序识别ANSI编码且汉字前面没有拼音,所以我们先将文档转化为ANSI格式:
Sogou to Google
接着按<Ctrl> +<F>进行查找替换,将汉字前面的拼音和那一个空格全部删除,使用正则表达式查找查找:
在查找(Find what)中写入:\'[\w\']+\s
替换为(Replace with)留空,并选择使用正则表达式查找,如下图所示:

按下右边的替换全部(Replace All)开始删除汉字前面的拼音,视导出词库中的词汇数目影响,替换时间会有所差异,在我的电脑上,这个操作用掉了大概90秒。
如果替换步骤成功,你将会看到这样的画面:(汉字前面的拼音全部消失了)
Sogou to Google
最后<Ctrl>+<S>保存劳动成果。
之后的操作就很简单了,将处理后的搜狗拼音词库使用转换器生成谷歌拼音的词库。导入谷歌拼音即可。
结束。

 

重要:搜索引擎只是收集信息的渠道,如果一款游戏或者一碟AV没有人上传,那么无论怎样搜索,我们也是得不到下载链接的,所以不要特别指望通过搜索引擎能获得一切资源,希望大家可以理解,多谢支持!在此也向所有在互联网上分享资源的全世界网友,致以崇高的敬意。

为什么要建立这个搜索引擎:

  1. 国内有不少能够下载18禁游戏AV的论坛,但是他们需要注册,否则不能查看其中的帖子,或者附件,但是注册好麻烦,注册之后还要等24小时才能发帖,我又不是发广告的,干吗要限制我,我可是很有诚意的。 
  2. 其中有些论坛虽然能注册,但是注册进去之后,你的积分不够,可能需要逛上数个月才能攒够积分。好吧,黄花菜都凉了,种子没人分流了,没法下载了……
  3. 看到了我找了好久、特想要的资源,注册一下吧。我嘞个擦!!!注册需要邀请??!!我该怎么办?这论坛,真是无语了……
     

解决问题的思路:

既然论坛里有人能发出这个资源,那么世界上就不会只有这一份,地球这么大,别人也能上传,我找个和你的一样的资源不就得了么,那样的话就不用注册你的网站/论坛啦~


=========================

如何找游戏(无中文名称游戏):

因为大家可能对日语输入法不熟悉,或者没学过日语,所以就会受到很大限制:可能输入不准确,即使能够输入准确,也不知道该搜索什么关键词。
  没关系,如果不知道该找什么,那么把能够列举出来的内容都列举出来,相信难度会有所降低:在这里,我们选取Getchu.com作为索引,这也是这个搜索引擎创建时,参考最多的网站之一。

  1. 通过游戏元素进行寻找(这也是我最为推荐的方法):

    访问这里(打开速度可能会有些慢):

     

    http://www.getchu.com/pc/genre.html

      这里面囊括了常见的游戏元素,例如:妹、人妻、女医生、巫女、SM、中出し、触手、三角関係……甚至连游戏发生的季节也有:春夏秋冬对应的分类。页面最下方的一大类也含有女性向的分类。总的来说,这个是非常全面的。
      通过这些元素,你就能快速的找到你喜欢的游戏类型,点击进入分类对应的游戏列表,你就能看到非常多的游戏名称了。Happy~~~
      之后只要注意一下游戏的发售日期(発売日一栏,如果不是很古老的游戏,那么根据统计学原理,我的这个自定义搜索引擎基本上可以找到他对应的BT种子下载,另外,未发售的游戏肯定是没有的了。一般游戏发售之后,大概一周左右,如果有人上传到检索范围内的网站,那么这个搜索引擎就能检索到。最关键的一步:复制游戏名称,返回搜索引擎,搜索游戏名称即可。

  2. 通过其他渠道:

    这里只是打个比方,比如你可以在这里:

    http://zh.wikipedia.org/zh-cn/2010年十八禁遊戲列表 看到2010年发售的18X游戏列表,那么你也可以根据这个列表里的名称进行搜索,当然了,在这里,你只能找到18X游戏~O(∩_∩)O

    总之,如果你不熟悉日语,那么只要想办法能找到游戏名称列表就好了……

 


=========================

关于如何寻找AV:

说实话,其实这个搜索引擎在最开始制作的时候,我完全没有想到会被同学用来搜索AV……,做的时候也没有特意的去关注过,对于怎么找AV的关键词或者分类,我还真是不在行……在此也向大家征集寻找AV关键词或者通过元素检索的网站,如果你知道有这样的网站,欢迎@我,我的ID:@Jyo_Ken_Takeshi

1月4日夜间补充:感谢
@MeteoraLy提供的检索网站:http://ec.sod.co.jp/


使用方法类似于找游戏的第一种方法,分类列表在网站左侧有一条。

  另外,有关AV搜索,可以参考AV女友列表,根据名字先找图片,然后挑漂亮的,把名字粘贴到搜索引擎的方框里搜索,哈哈,我也很聪明啊: 

 

http://zh.wikipedia.org/zh-cn/AV女優列表

http://ja.wikipedia.org/wiki/AV女優一覧  


=========================

关于寻找其他资源:

据同学说,他发现有人用这个页面能够搜索出H漫画什么的,貌似还有能搜索仓木麻衣的演唱会什么的……
   我想说的是,其实我们只是提供一个入口,至于用户去搜索什么,我们不会去过问,只有我们做不到,没有网友想不到,所以大家可以随便试着去搜索有趣的关键词,也许有意外发现,祝您好运!


=========================

关于如何翻墙搜索:

 

首先,点击搜索引擎页面上提供的任意一个自由门下载链接(其中,115网盘的镜像有密码,密码是上传者的ID)。

 

之后,运行自由门,并查看连接之后的端口(这个就是马上要填写代理地址中的端口),如下图所示:
代理设置——端口
接着在浏览器里面设置代理(在哪里设置代理,请谷歌或者百度搜索一下),一般有两种情况:

 

有些浏览器只有一个方框填写代理,那么就填写:

 

127.0.0.1+冒号(英文输入状态)+端口地址 例如:127.0.0.1:8580

 

有一些浏览器把端口填写的地方独立出一个方框:

那么就把服务器和端口分开写,不用打冒号如图:
代理设置——分栏填写端口

最后,在代理设置好以后,重新打开搜索引擎页面,你就可以无视敏感词进行搜索了,也不会无故的连接被重置~~~

 


感觉传统的历史记录没有新鲜感?觉得传统的历史记录不能反映自己的浏览习惯?没关系,Chrome浏览器的HistoryStats插件。

该插件可以让你的Chrome显示浏览历史记录,显示同一网站的浏览次数,还有最近的访问时间,并按照不同分类进行排序查看:
 
Chrome History Extension


Tfcra_Weblog
design&photo by [Aloeswood Shrine / 紅蓮 椿] ■ powerd by [忍者BLOG]
忍者ブログ [PR]
フリーエリア
=======================
在这里搜索成人资源 =^_^=
アダルトリソース検索 =^_^=
Search Adult Resources Here: =======================
Translate this page to your language:
=======================
=======================

=======================
=======================
free counters =======================
カレンダー
12 2025/01 02
S M T W T F S
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
ブログ内検索
バーコード
最新記事