只需一步,快速开始
23
160
317
初级会员
使用道具 举报
42
726
1031
中级会员
fei 发表于 2016-2-26 12:09+ `2 u9 E, \) m0 P2 e shuf test.txt > output.txt
4
564
1007
quanchengxue 发表于 2016-3-28 09:11& Y p. i5 f( {- e8 S- }3 l6 e 你一篇文章需要多少行数据?我的情况是每篇100行,一共200M的txt,分割成了200个txt文件,文件名1.txt到200 ...
bluescharp 发表于 2016-3-28 15:29- v9 B! {6 Q. ~: |1 I# A6 q3 d* d 随机文章写入数据库吗?不然每次访问结果都不一样?+ {8 Y, g* `7 H: S; P0 I% }" } 一共生产多少文章?我之前试过,不过不是直接句子的 ...
quanchengxue 发表于 2016-3-28 15:54 ( f; L8 q: Y, l5 a' {# K不写数据库,直接生成缓存,或者直接生成HTML文件,缓存目录用两层,第一层用MD5的12位,第二层用34位, ...
bluescharp 发表于 2016-3-28 19:43 + Q8 j$ J+ [# T6 q! W" O, y我之前也是用文件缓存。一方面是小文件太多,I/O效率低。另外一方面,删除起来不是一般的麻烦。 ' e5 `: b; E8 [: }, f而且文件 ...
7
2
111
quanchengxue 发表于 2016-3-28 22:20 % f+ ~8 P" B& y! @% k3 @" Q9 L8 s我的数据没你的那么多,最多的时候生成了200多W缓存,我自己的情况倒是没发现I/O效率低的情况,google爬 ...
0
3
禁止发言
本版积分规则 发表回复 回帖后跳转到最后一页
使用QQ帐号登录论坛的用户
关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN
GMT+8, 2026-6-24 23:46 , Processed in 0.063933 second(s), 21 queries , Gzip On, MemCache On.
Copyright © 2001-2023, AdvertCN
Proudly Operating in Hong Kong.