Python处理中文的时候的一些小技巧

Python处理中文的时候的一些小技巧

相信第一次处理中文的朋友们可能都会对中文的encoding 和程序的报错很头疼。

如果你像我一样希望能够把事情尽快做好而不去深究,你可能会写一些异常处理的代码把 UnicodeEncodingError糊弄过去先,但当你开始怀疑有多少encoding出错的信息被你丢弃的时候,可能你会很惊奇。于是,你还是会想坐下来,(洗把脸)然后面对自己必须弄懂什么是utf-8,什么是 ‘gb2312’, 什么是 ‘gbk’ 和其中的猫腻。正如有时候猛撕小伤口上邦迪胶布的快感一样,有时候当你认真面对一些你平时一直回避的问题的时候(其实有时候需要的不是勇气), 你反而会觉得“不过如此”,并且能够一劳永逸的解决问题。

关于Python处理Unicode,我所能找到的最言简意赅的入门教程是:

Unicode In Python, Completely Demystified (揭秘Python Unicode)

简要罗列一下最重要最实用的点:

阅读全文 Read More

好烂啊有点差凑合看看还不错很精彩 (7 人打了分,平均分: 4.71 )
Loading...
Python脚本如何对文件通配符匹配

Python脚本如何对文件通配符匹配

有时候,我们可能会写一些轻量级的脚本去处理很多符合某种pattern的文件,例如“某目录下的 *logfile.csv” 但是,我们大多数脚本的参数都是 sys.argv, 如何解析 wildcard 匹配呢?

test.py

 from glob import glob
...
if __name__ == "__main__":
    file_names = glob(sys.argv[1])
    for file_name in file_names:
        do_something(file) 

这样就可以像使用其他终端命令一样使用脚本test.py 进行wildcard匹配了

>> test.py ./*logfile.csv

好烂啊有点差凑合看看还不错很精彩 (1 人打了分,平均分: 5.00 )
Loading...
9个强大免费的PHP库

9个强大免费的PHP库

1. ReCAPTCHA

reCAPTCHA  允许你的网站集成一个Advanced CAPTCHA 系统,这个系统可以帮助你阻止一些垃圾信息。可视化的CAPTCHA 同样也有一个有用的声音功能。另外,在reCAPTCHA 服务里,这个PHP库也包含了一个给 “Mailhide” 服务用的API,这个可以把你的邮件地址隐藏于一些抓邮件地址的程序。

这个API是免费并且非常容易使用的,你需要做的就是申请一个API的KEY。

ReCAPTCHA

下载 ReCAPTCHA | 获取一个API Key | 相关文档

阅读全文 Read More

好烂啊有点差凑合看看还不错很精彩 (2 人打了分,平均分: 5.00 )
Loading...
Python中实现多属性排序

Python中实现多属性排序

我们有一组记录:

list_records =
(
 (department, name, salary),
 (department, name, salary),
 ...
 (department, name, salary)
)

然后我们想进行类似 MS – Excel 里的 “then sort by” 中的功能一样先基于department排序,然后再在部门内按照salary排序。

其他编程语言可能相对复杂,我这里写出一个用Python实现的最简方法(也许有比这个还短的,来挑战吧)

阅读全文 Read More

好烂啊有点差凑合看看还不错很精彩 (4 人打了分,平均分: 4.75 )
Loading...
程序员需要具备的基本技能

程序员需要具备的基本技能

软件开发是一个跨度很大的技术工作,在语言方面,有C,C++,Java,Ruby等等等等,在环境方面,又分嵌入式,桌面系统,企业级,WEB,基础系统,或是科学研究。但是,不管是什么的情况,总是有一些通用的基本职业技能。

这些最基本的职业技能通常决定了一个程序员的级别,能否用好这些技能,直接关系到了程序员的职业生涯。很多程序新手也是因为缺少、达不到或是不熟悉在这些基本技能,所以,他们需要有老手带,需要努力补齐这些技能。而高级程序员应该非常熟悉这些基本技能,而且有能力胜任并带领其他经验不足的程序员。

下面这些基本职业技术可以用来做为对一个程序员的评估,很明显,下面的这些技能都可以用来做面试。虽然,还有很多非技术的因素,但对于评估一个程序员的技术能力来说,其应该是足够的了。

下面是程序员所应该具备的基本职业技能:

阅读全文 Read More

好烂啊有点差凑合看看还不错很精彩 (57 人打了分,平均分: 4.77 )
Loading...
4月14日,微软补丁日

4月14日,微软补丁日

下周二,微软准备release至少8个以上的安全补丁,如下表所示。目前没有太多的信息,不过,我们知道的是其中Excel的那个BUG早在2月份的时候就报告了,http://www.microsoft.com/technet/security/advisory/968272.mspx,可是这么长的时候后才有patch。哎。

这次的BUG数之多,覆盖面之广(包括IE,Office,DirectX,Windows …),看来,下周二各个公司的IT部门又有得忙了。

编号

严重程度

攻击方式

重启

影响的软件*

Windows1

严重

远程代码运行

需要重启

Microsoft Windows, Microsoft Office

Windows2

严重

远程代码运行

需要重启

Microsoft Windows

Windows3

严重

远程代码运行

可能需要重启

Microsoft Windows

IE

严重

远程代码运行

需要重启

Microsoft Windows, Internet Explorer

Excel

严重

远程代码运行

可能需要重启

Microsoft Office

Windows4

重要

获取更高权限

需要重启

Microsoft Windows

ISA

重要

拒绝式服务

需要重启

Microsoft Forefront Edge Security

Windows5

中级

获取更高权限

需要重启

Microsoft Windows

相关信息可以参看这里:

http://www.microsoft.com/technet/security/bulletin/ms09-apr.mspx

好烂啊有点差凑合看看还不错很精彩 (2 人打了分,平均分: 4.50 )
Loading...
一个排序算法比较的网站

一个排序算法比较的网站

下面这个网站是一个非常丰富的排序算法的网站。

Sorting Algorithm Animations
http://www.sorting-algorithms.com/

这是一个非常不错的排序算法的网站,当你打开这个网站的时候,请不要因为看到很多个图片的大红叉而鄙视它。你先点击网页上方的Problem Size,选择一个尺寸,20,30,40还是50,都行,于是你就可以看到下面整个大表中有图片显示出来了。如下所示:

sort

阅读全文 Read More

好烂啊有点差凑合看看还不错很精彩 (15 人打了分,平均分: 5.00 )
Loading...
十大史上最恶心的操作系统

十大史上最恶心的操作系统

Computer World上有人评出了有史以来十大臭名照著的操作系统,我们来看看倒底有那些,顺便也回顾一下操作系统的历史。下面的顺序通过时间顺序由古至今。

OS/360, 1964

这里,说的不是后面新版的OS/360,这里说的是60年代未70年代初的第一版的OS/360。当时的Project Manager,Fred Brooks, 《人月神话》 The Mythical Man-Month的作者,这是一本非常经典的告诉你软件开发是如何失败的一本书。在书中,Brooks解释说,他们需要了比较计划更多的内存,最后导致了预算超标了好几次,当然,最终这个操作系统还是很慢。另一方面,这本书中也出现了一句网络上的流行语:”Adding manpower to a late software project makes it later.” (在项目的后期加入人手只会让项目更拖)Brooks 喜欢像一本软件开发者的圣经一样描述,因为”everybody reads it, but nobody does anything about it.” 在书中他展开描述了这个故事后,我们才知道他是对的。

阅读全文 Read More

好烂啊有点差凑合看看还不错很精彩 (4 人打了分,平均分: 3.75 )
Loading...