诗和远方 - 评《四时之美》
上次看完了无所畏,最后一节说“天用云作字”,想想就感觉意境很美。公司的楼顶是一圈跑道,视野很好。我想起来很多个爬到楼顶的中午,天高云淡,极目远眺,近处看到百望山,远望能看到盘古。不过憋半天,也想不出别的词儿,每次都是一句“真TM蓝啊”,“真TM远啊”🏙
上学时背唐诗,只觉得朗朗上口,大多不解其意;上班了写程序,越来越习惯逻辑思维和方法论,而且厂子越大,什么鸟都有,戾气越来越重,经常一轮开会,心中一万句草泥马飞过。冯唐从他的麦肯锡咨询工作里悟到了很多,譬如《把美一点点找回来》,如何去思考美好的东西。所以看了这本书,《四时之诗:蒙曼品最美唐诗
》。
春有百花秋有月,夏有凉风冬有雪。若无闲事挂心头,便是人间好时节。
二十四首唐诗,对应二十四个节气。一年四季春秋交替,造出不同的景儿;...
leveldb笔记之10:sstable读取
1. 简介
前面介绍了 sstable,包括 sstable 的结构组成及写入的源码分析,本文主要介绍下对应的读取过程,能够帮助读者更深入的理解一个 sstable 的数据格式。
2. 基本过程
sstable 的读取过程,简单总结就是四个字:按图索骥。
各个索引在这个过程发挥了很大的作用。
首先是 seek 到文件末尾读取固定48个字节大小的 footer,这也是为什么footer是定长的原因.
然后解析出 meta_index_block 以及 index_block。
通过 meta_index_block 解析出 filter block,通过 index_block 解析出 data_block.
查找时,先通过 filter block 查找是否存在,然后通...
《无所畏》读书笔记
从《万物生长》三部曲喜欢上冯唐的书,然而之后再看《活着活着就老了》、《三十六大》就再也没有惊艳过。
这个人臭牛逼,目空一切,怼天怼地怼空气的文风,最开始读着舒畅,读多了开始疲惫,审美疲劳,甚至觉得哗众取宠,语不惊人死不休。
直到读了这本《无所畏》,对这个垂杨柳长大的京片子、协和医学博士、麦肯锡合伙人、华润大佬、作家,又有了不同的认识,有时候会觉得这个比我大十几岁的人,是一个充满了人生智慧的老流氓,他说的话固然直接,但是真性情。他所写的,确实如他所做。他所做的,确实如他所说。他所说的,确实真知灼见。
换个稍微理性点的说法,他不是无意义的吐槽,他的吐槽,经过思考。
油腻中年男这个词,出自冯唐《如何避免称为一个油腻的中年猥琐男》,《比成为油腻中年更可怕的是成了油腻青年》。奇怪的是,这...
2018-review-and-2019-plan
盼了很久,18年的网易云音乐还是没有年度报告。不过我自己想了下,听得最多的大概是这首《不谓侠》了,原版是萧忆情唱的,男声,我偏爱翻唱的这版,女声,听着听着仿佛有种穿越的错觉,纵马从塞外走到江南,路过树林外的小酒家,看满城飞花,对春风与红蜡。
从去年开始,便告诉自己,不再流水账似的记录总结与展望了。写这篇笔记之前,我翻了下去年笔记里的 flag,大概完成了一半不到,再往前翻,也大抵如此。然而越往前翻,感慨越多,只因看到多年前的自己,为一些事情开心、困惑、认真、烦恼,一路走来的脚印清晰起来。
1. 博客
去年定的博客更新目标是25篇,我数了下,完成了27篇。实际上早就忘了25这个数字,因此这27篇笔记,完完整整的是我想去写的,没有一篇凑数。
写的时候,我总是在想,一篇笔记写出来,怎...
3 Goals for Better Code
这篇笔记是关于 Sean Parent 在2013年的一篇演讲,题目就叫做《3 Goals for Better Code》,听完之后有比较多的共鸣和触动,因此专门记录下来。
关于 Sean Parent其人:
Sean Parent is a principal scientist and software architect for Adobe Photoshop and mobile imaging applications.
1. No Raw Loops
A raw loop is any loop inside a function where the function serves purpose larger than the algorithm ...
豆瓣笔记分析
豆瓣笔记是指形如https://www.douban.com/note/699086917/这样链接样式的帖子,严格来讲,我没有搞清楚豆瓣对于这款产品的定位,话题广场、日记、豆列下的文章似乎都在其中。
想做这个事情,缘起于单纯想看看这个文艺网站下的青年们在关注什么。
另外一个是很久不爬东西了手痒,厂长经常说不忘初心,我的初心有一部分大概也是 spider.
断断续续爬了130w+的文章,用的 scrapy,代码就不介绍了,放到了TinyTools这里,这里贴下一些结论。
1. 200 vs 404
个人觉得判断豆瓣是否重视这个产品可以看下死链率,从 scrapy 运行日志可以很轻松的拿到,匹配Crawled (200)或者Crawled (404)即可。
其中 404 页面...
papers of bloom filter
bloom filter 的相关论文较多,按照时间线整理了下自己觉得比较有意义的。有些观点没有找到佐证的中文资料,如有错误还请指出。
1. Space/Time Trade-offs in Hash Coding with Allowable Errors
Burton Bloom 在1970年发表的文章,布隆过滤器的开山之作。
给定一个 set,查找某个 key 是否存在于该 set,通常考虑两点:
time: 查找时间
space: 空间成本(例如 hash 目标区域大小)
Burton Bloom 在论文里提出了第三点:Allowable Fraction of Errors. ,即允许一定概率的误判,来获取空间成本的显著降低。
A Sample Appl...
226 post articles, 29 pages.