我认为PyData时代的代表是Wes McKinney,以及他的pandas。还有他的书《利用Python进行数据分析》。
我认为PyData社区在这点上做的很好。R语言还是有些做的很好且无法超越的地方。我认为其中一个常规数据统计,还有一个是可视化。有些人在致力于解决这些问题。
PyData遍布世界各地,这一系列会议促进了数据科学的发展。数据科学与数据计算是不同的,之前SciPy时代则是围绕这点的。当然以上这些时代都是同时存在的。有人使用Python写脚本,有人使用SciPy工具,有人使用PyData。
(文末有彩蛋! )
Wes专门写了pandas,因为他想做到R语言对数据框的操作。John Hunter专门写了Matplotlib,因为他想用MATLAB的方式进行绘制,但不必使用MATLAB许可证。
原标题:为什么说 Python 是数据科学的发动机(一)发展历程(附视频中字)
但多年来越来越多的人都在用Python,这把瑞士军刀变得复杂起来了。这么多的工具,我们需要选择用哪个记住顺序,从而你能找到你想要的。这里的优势在于Python存在巨大的能力空间,但缺点在于从哪儿下手。
在上世纪90年代,我认为Python以及数据科学处于脚本时代。这时的座右铭为"Python是Bash的替代品”。
我认为在SciPy时代的关键会议是SciPy大会。SciPy大会驱动了很多创新力,从2002年一直到如今。在场我认识的几个人将出席下周的SciPy在奥斯汀的会议,这是非常有意思的会议,如果有机会的话我建议你们参加。
2010s: PyData时代
免责声明:凡本网注明 “来源:XXX(非中国房产新闻网)” 的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。