采集时为什么推荐CSV文件而非Excel文件

作者:JerryXia | 发表于 , 阅读 (40,538)
什么是CSV?CSV(逗号分隔值)格式是最常见的数据库和电子表格导入和导出格式。什么是Excel?微软Excel是由微软开发的用于电子表格处理的应用程序,XLS文件是Excel的文件存储格式。我们通常说Excel格式指的就是XLS格式。CSV格式比Excel格式具备的优势:1)CSV是纯文本文件,支持追加模式写入,节省内存。Excel是结构复杂的二进制文件,只支持一次性写入,较费内存。2)CSV的文件行数没有限制,在实际项目中我们已输出过上千万行的CSV文件;32位系统下Excel单个Sh... 阅读全文

正则表达式之去除font和span标签

作者:JerryXia | 发表于 , 阅读 (5,050)
在程序爬行网页时有个很头疼的问题,就是网页中有很多无用的修饰性的标签。一个一个删的话工程量太大,幸好平时接触过一些正则表达式,先看看以下内容:<p><font style="font-size:16px;font-family:宋体"><span lang="zh-cn">如何使用</span></font>sed<font color="#0df2a3">&... 阅读全文

C#中File类与FileInfo的区别

作者:JerryXia | 发表于 , 阅读 (1,852)
一.File類別與FileInfo類別:使用File類別進行檔案操作時,每次都會進行安全性檢查。FileInfo類別則只會於第一次進行安全性檢查,如果你需重複使用物件好幾次,請考慮使用 FileInfo 的執行個體方法,以取代 File 類別的對應靜態 (Static) 方法,因為安全性檢查並不一定會需要。二.指定路徑:C#語言下路徑指定方式有兩種:是使用兩個斜線,例如 “C:\Test.txt”第二種是在路徑前加上@符號,例如 @”C:Test.txt”三.FileInfo的檔案操作EX... 阅读全文

周报的逻辑—为什么要写周总结?

作者:JerryXia | 发表于 , 阅读 (2,901)
摘自一封内部邮件,公开也无妨。最近新同事加入很多,按照我的要求,入职半年内需要发送周报给我,半年后自己选择是否仍需发送。这里有个看起来很愚蠢的问题。为什么要发周报?行业内可能大部分的人都认为,周报就是流水账,是主管显示权力的手段。最后还就真把它给搞成了一封流水账,或寥寥数语。但这是错误的理解。在职场中,有一条冷酷定律,叫做“如果主管不知道你做了某件事情,相当于你就没有做过这件事情。”听上去不近人情,其实完全符合实用逻辑。工作分很多类别,有结果容易显露出来的,比如策划案;有不容易显露出来的,... 阅读全文

Visual studio 2008/2010快捷键

作者:JerryXia | 发表于 , 阅读 (1,518)
快捷键 功能ctrl+k,c 注释选中行ctrl+k,u 取消对选中行的注释CTRL + SHIFT + B:生成解决方案CTRL + F7 :生成编译CTRL + O :打开文件CTRL + SHIFT + O:打开项目CTRL + SHIFT + C:显示类视图窗口F4 :显示属性窗口SHIFT + F4:显示项目属性窗口CTRL + SHIFT + E:显示资源视图F12 :转到定义CTRL + F12:转到声明CTRL + ALT + J:对象浏览CTRL + ALT + ... 阅读全文

安裝SQLServer-Performance counter registry failed

作者:JerryXia | 发表于 , 阅读 (2,026)
最近在Windows 7安裝SQL Server 2008時發生"Performance counter registry hive consistency" failed 效能計數登錄器的問題,直接查詢錯誤訊息上出現的微軟官網 http://support.microsoft.com/kb/300956 解決方案支援版本沒有windows 7,後來在網路上查到解決方式,下面記錄一下處理步驟:錯誤訊息:設定:執行"regidet.exe" , 開啟登錄編輯程式。找到對應路徑hkey_loc... 阅读全文

前端编码规范

作者:JerryXia | 发表于 , 阅读 (4,407)
为了保证前端代码质量,提高团队协作开发效率,提升沪江网站产品质量,制定此文档。文档包含通用规范、HTML规范、CSS规范和Javascript规范。文档也在不断修订完善中。一、通用规范**文件与目录一律小写,必须是英文单词或产品名称的拼音,多个单词用连字符(-)或下划线(-)连接。只能出现英文字母、数字、连字符和下划线,严禁出现中文。该命名规范适用于 html, css, js, swf, php, xml, png, gif, jpg, ico 等前端维护的所有文件类型和相关目录。js ... 阅读全文