内牛满面的下载速度..

泪目


请允许我抹掉两个公网ip地址

カテゴリー: 未分類 | 1件のコメント

抜いても大丈夫だよ~

禁不住诱惑
刷了bios装了win7…

第一件事当然就是处理一下这个4G内存的问题

32位windows也是能跑4G以上内存滴

嗯..用的是一个叫窓辺ななみ的主题
说起这个madobenanami的主题
那天在公司.当奈奈说出如标题这句话的时候
引来无数人侧目…
还好我知道这肯定是个ぬく不是ぬぐ
不然我也要满脸黑线了…

脱いでも大丈夫だよ~
-_-

カテゴリー: 未分類 | 1件のコメント

うん。。満点ね。。

 A:隊長!第二防衛線が突破されましたが、巨大怪獣はまっすぐ中央管理システムに向かっています。このままではまだ三十分は持ちません!
 B:いま出せるモビルファイターは?
 A:ゼロ号機だけです。
 B:やむを得ん四号機を出すぞ!
 A:四号機はまだテストが完了していません、それに、操縦できるパイロットが現在誰も。。。。。
 B:ゼロ号機ではやつの侵入は防ぎきれん。。。ここは。。。私はいく。
 A:隊長自ら?でもその怪我では?四号機の加速に耐えられません!
 C:私がいきます。
 A:アスカ?
 C:私なら四号機を操ります。お願いです、行かせてください!
 B:だが、お前ではまだ訓練中のみだ。いまは子供の出る幕じゃないぞ!
 C:そんなこと言っている場合じゃない!
 B:おえ!アスカ!待って!
  (四号機、発射準備完了しました)
 B:アスカ。。。。頼むだぞ。。。

カテゴリー: 未分類 | 1件のコメント

再一次让我哭笑不得的apple

今天apple发布新产品
其中有一款多点触摸的鼠标(iphone用的技术)
当然他是蓝牙无线的…

而我用过2个btmm
在macpro上都出现掉祯的现象
而在apple store上原先的btmm的user review里面
也有很多人反映说btmm+macpro就是个杯具
还让拥有macpro的人stay away from btmm
据说是因为macpro引以为傲的超厚铝制机箱壳子很perfect的屏蔽了蓝牙信号

于是我听老人言
stay away了

但是今天看到这个新鼠标.
真的好心动..
可惜这个perfect的铝壳让我很是无奈

于是就想着google一下看看macpro的朋友还好吗
但是看着google到的结果..
真的是又杯具了一回…

原来鼠标掉祯确实是因为信号的问题
但是造成信号问题的根源并不是机箱壳
而是因为apple接错线了…
-_-

一共有4根天线
apple是这样接的
其中2根接在airport无线网卡上
一根接到蓝牙上
还空着一根..

正确的接法是把接到蓝牙上那根线拔掉
然后把airport上2根中间的位于上方的那一根线拔下来接到蓝牙上
然后把原来空着没接的那根线再补接到刚刚从airport上拔下来的位置上…

apple是这样接的.

需要改成这样

我姑且把活马当死马医了一回..
结果内牛满面……..

apple新鼠标…我来了……

カテゴリー: 未分類 | 2件のコメント

无它只是一张图片追加

作日语本地化的时候
才发现自己有好多天天都看到的单词
知道是什么意思却不会发音
Orz

カテゴリー: 未分類 | コメントをどうぞ

sharedb

自从把512k的adsl换到2m以后
我就成了share党的一员
每天欢快的从share上拖dvdiso,bdmv
几乎完全不再使用bittorrent

不过也有不少麻烦
share上的资源太多.每天更新的记录远非bt能比的
每天人肉看大马哈鱼我都觉得受不鸟
更不要提那恐怖的share了..

后来有人告诉说可以rss嘛
于是用google reader看了看大马哈鱼..哟还不错.

但是等换到sharedb.info的时候.才发现sb了
sharedb.info上的rss不怎么对…
老是错过好些东西…
就好比7天前的那个老片"听到涛声"我今天才看到

于是想着自己做一个sharedb出来..
=======================================
在sharedb.info上写得清清楚楚这些文件信息是从2ch的download版来的.
2ch是日本最大的一个留言版.涵盖各方各面,什么新闻啊游戏啊动漫啊社会啊生活啊应有尽有
而这个download版呢
网友都把share上的文件信息贴到这个版里面
要做的就是分析这个download版里面的全部帖子,并提取这些帖子里面的文件信息

首先http get download版的subject.txt
这个文件里面是download版的全部thread的列表,
其中每一行表示了一个thread,这一行内容是thread的id,标题以及有多少层楼
可以使用正则表达式来提取每个thread的信息

然后遍历这个thread列表,
对于每个thread,使用thread的id来做http get请求,得到这个thread的dat文件

这个dat文件里面放的就是这个thread全部内容
每一层楼占据一行.这一行里面至少由4个部分组成(第一层楼主有5个部分,多一个标题)
这一层楼里面的文字就在这4个部分的最后一个里面

通过读取这个dat文件就能获得全部的回复(也包括楼主)的内容
接下来就是用正则表达式来分析全部的回复.
遇到看起来像是share文件信息的就记录下来..

一个正常的share文件信息看起来是这样的
可以有任意空格的文件名(空格)上传ID(空格)文件大小(空格)文件hash值
关键的地方就在于文件的hash值是一个16进制字母组成的字符串,他的固定长度是40
利用这个信息可以很好的定位一个看起来比较像的share文件信息

上面这个格式可以省略上传ID
这样文件名和文件大小之间有2个空格.
要是用pcre来写..大概可以是这样
‘ {0,1}(.+?) (|[^ ]+) ([0-9,]+) ([0-9a-fA-F]{40}) {0,1}’
开头的空格和结尾的空格是2ch的版式

上面这个正则能很好的匹配绝大多数的文件信息
不过也有些网友贴的信息不符合这个标准格式
比如当没有上传ID的时候,文件名和文件大小之间只有一个空格而不是正规的2个
这种情况下上面这个正则在文件名里面有空格的时候将匹配而在文件名没空格的时候失败
这可以把上传ID后面的空格设置成可选,这样就不会错过
但是会造成把ID也算文件名里面的情况.

也可以在ID上做做文章.
share里面生成的ID是这样的格式
.{1,8}[0-9a-zA-Z]{10}
可以用这个正则来限定一下id
不过据观察发现也有id不是这个格式的.

还可以在文件名上做文章
通常的文件名都是3个字母的后缀
可以使用3个字母的后缀紧接一个空格的方式来界定文件名

不过没太大关系.
share依靠的是hash值来标记每个文件,而不依靠文件名
所以即使文件名有错,只要hash对了就成.

如果从头开始刷新整个download版并分析每个thread里面的每层楼
那是是非常慢的.
我这边的网络情况,全部分析完大概有700多个thread,耗时近2个小时.

所以你需要缓存已经分析过的thread列表,里面需要记录每个thread你已经分析到第几层楼了
只有在有新的回复的时候才再分析那些新的回复
也就是做一次差分.
经过第一次初始化分析以后,可以定个时.每5分钟做一次增量分析
增量分析的速度很快的.按照目前2ch的流量来看,一次增量大概只要不到1分钟就能处理完毕.

至于如何做缓存如何记录全部的文件信息
既然叫db,那肯定是用数据库了.mysql好了.

目前我只是做了一个数据收集
然后用php做了一个显示.
计划是用cocoa做一个类似rss的软件.

目前收集到的数据情况,一共731个thread,里面有39011个文件

剽窃了sharedb.info上的css

カテゴリー: 未分類 | 1件のコメント

闲的时候吧闲得要命

忙的时候吧
也tm要命

カテゴリー: 未分類 | 2件のコメント