平时看到的 Python 的 decorator 都是使用函数来写的,比如说我之前在写的 login_required def login_required(func): @wraps(func) d...
winnowing 算法
最近尝试将 winnowing 算法应用于抄袭检测中,这是一种字符串指纹算法,详细的内容见下面这篇论文。 Winnowing Local Algorithms for Document Fingerp...
Python内部机制(1) - 垃圾回收
首先介绍下主流的垃圾回收机制,原文在 http://www.zhihu.com/question/20018826/answer/28892543 引用计数(reference counting): ...
今天遇到的Python多线程、多进程中的几个坑
今天在写oj的判题端的时候犯了一个低级错误,就是为了加快判题速度,我就采用了多线程多组用例同时运行的方法,但是后来不经意的发现,明明跑的很快的程序到了我这实际运行时间就变成了好几倍,而cpu时间并没有...
Django的信号和观察者模式
今天想到给以前写的东西增加缓存支持,每次数据库发生变化之后主动的去修改缓存。当然最笨的方法就是在每次更新数据库的代码后面写一段更新缓存的代码,我们能不能在数据库被更新之后对外发一个信号呢,更新缓存的函...
验证码常见安全问题
(1). 验证码在页面或者cookies中输出。这个时候只需要提取一下就能直接使用了。经过加密的也不行,也可以直接去替换密文。 (2). 验证码验证完成后没有销毁,导致验证码重复使用。 验证码的值是在...
一致性哈希学习
最近总是听到一致性哈希,但是不了解具体的技术详情。今天搜索了一下,记录下来。 应用场景 这里我先描述一个极其简单的业务场景:用4台Cache服务器缓存所有Object。 那么我将如何把一个Object...
python __new__和__metaclass__
先说__new__ __new__原型为object.__new__(cls,[...]),cls是一个类对象。当你调用C(*arg, **kargs)来创建一个类C的实例时。python内部调用是C...
LRU Cache
https://oj.leetcode.com/problems/lru-cache/ 这个题目在leetcode连续很长时间都是热门题目,也听说面试的时候有遇见过的,今天下午就认真的做了一下。 Ca...
使用Python的mock模拟测试
最近写的项目里面有一个创建预约成功后就给客户发一条短信或者邮件的功能,但是怎么去自动化的测试这个功能呢,难道每次都要发送一遍,然后去看么。这时候我们就可以引入Python的mock测试,我们首先来看一...
Python Scrapy 爬虫框架 | 6、继续爬虫、终止和重启任务
0x00 前言有时候我们不想只爬一个页面的,比如之前我只爬了主页,但是现在想把其他页面的也爬下来,这就是本文的任务。0x01 修改代码在之前的基础上,修改 teamssix_blog_spider.p...
11