Life
读书总结:Open Life
这本书从作者身边的生活琐事开始来思考开源这件事,到开源软件发展对社会影响思考,再到开源软件的商业之路,最后到生活中其它方面开源的思考。逐一到来非常有序,让我们对开源的认识从原来只是软件的层面会逐步上升到对生活方式的思考。
March 14, 2020
用户画像数据建模方法(zz)
原文:http://blog.baifendian.com/?p=8015 从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚 焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技术。伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。相比传 统的线下会员管理、问卷调查、购物篮分析,大数据第一次使得企业能够通过互联网便利地获取用户更为广泛的反馈信息,为进一步精准、快速地分析用户行为习 惯、消费习惯等重要商业信息,提供了足够的数据基础。伴随着对人的了解逐步深入,一个概念悄然而生:用户画像(UserProfile),完美地抽象出一 个用户的信息全貌,可以看作企业应用大数据的根基。
January 14, 2015
zz分布式文件系统FastDFS架构剖析
【本文系外部转贴,原文地址:http://www.programmer.com.cn/4380/】 FastDFS是一款类Google FS的开源分布式文件系统,它用纯C语言实现,支持Linux、FreeBSD、AIX等UNIX系统。 它只 能通过专有API对文件进行存取访问,不支持POSIX接口方式,不能mount使用。准确地讲,Google FS以及FastDFS、 mogileFS、HDFS、TFS等类Google FS都不是系统级的分布式文件系统,而是应用级的分布式文件存储服务。
May 4, 2014
扩展sawzall代码实现自定义接口
使用sawzall开发mr程序虽然很快,不过也有不少限制,尤其对于新手来说,比如不能直接像c++一样调用线程的库,不过它提供了一种扩展开发的方式,我们可以自己修改sawzall代码实现新的功能接口,在下载平台的sawzall代码中,我们就扩展了一种聚合器,两个和我们web相关的功能接口:连接我们的domain service进行聚合域名的识别,根据url进行域名提取。这里以使用我们comm库中的url类进行域名提取为例来说明一下sawzall的功能函数扩展。
May 4, 2014
海量数据分析:Sawzall并行处理(中文版论文)
海量数据分析:Sawzall并行处理(中文版论文) Google的工程师为了方便内部人员使用MapReduce,研发了一种名为 Sawzall的DSL,同时Hadoop也推出了类似Sawzall的Pig语言,但在语法上面有一定的区别。今天就给大家贴一下Sawall的论文, 值得注意的是其第一作者是UNIX大师之一(Rob Pike)。原文地址,并在这里谢谢译者崮山路上走9遍。
May 4, 2014
嵌入式开发中NFS调试环境搭建-V0.2
作者:许振文 开发环境:S3C4510B+uCLinux-2.4.x+ubuntu7.10 建立的目的:可以直接在开发板上挂载开发主机上的文件系统,减少程序的烧写次数,提高程序开发速度。 NFS(Network File System, 网络文件系统)可以通过NFS把远程主机的目录挂载到本机,使得访问远程主机的目录就像访问本地目 录一样方便快捷。 NFS一般是实现linux系统之间实现共享.当然和unix之间也应该可以使用它来实现共享。但如果需要在linux和windows系统之间共 享, 就得使用samba了!, NFS是一个RPC服务程序,所以在使用它之前, 先要映射好端口——通过portmap设定. 比如: 某个NFS client发起NFS服务请求时, 它需要先得到一个端口(port).所以它先通过portmap得到port number.所以在启动NFS之前, 需要启动portmap服务!
April 6, 2014
svn中分支开发实践学习
从去年年中开始,在公司就一直是团队开发作战,代码也是使用svn管理,虽然事用svn管理,但是一直只是把svn作为简单的代码仓库来使用,并没有使用svn的其它功能,所有的人都在master上作修改提交,所以代码的管理十分混乱,上线不好做版本发布包,因为我可能提交了多次,中间其同学也提交了n次,导致最后版本发布包制作极为麻烦。
March 26, 2012
一个json数据格式导致的杯具
今天业务组的同事反馈系统数据入库失败,而且耗时耗力。。。老大说谁上,我主动请缨了。 查查查。。。从操作追到代码(这些代码不是我写的哇),最后日志发现了,是数据请求回来的地方出了问题,呃,会不是是请求的服务挂了呢,再日志了请求结果,发现,没有问题,最后发现问题处在了json_decode()这里,数据经过这家伙处理之后,竟然没有了,难道数据黑洞?
July 12, 2011
Helight.Xu's GNU/Linux
Zhwen Xu(Zhenwen Xu, 许振文 in Chinese), post-graduate student majored in the CS Department of Xi’an University of Post and Telecommunications.
January 18, 2010
又是一个岁终年末的随想
依我个人的观点看,往往岁终年末是一年之中比较乱乱的时候。人们的心情 开始慌乱,急躁。毕竟要过年了。好像是劳累的一年了,也应该休一下了。对待工 作生活是不是开始怠慢了呢?呵呵!! 也是阿,又是一年的岁终年末了。
December 25, 2008