数字化时代的利器-PYTHON工具箱

郑磊 原创 | 2020-05-18 19:34 | 收藏 | 投票
关键字:数字化时代 Python 工具箱 

 郑磊

 

自从计算机进入了微机时代,人们的工作就发生了本质性改变。几乎大部分手工处理的信息,基本上都需要用电脑软件进行加工处理了。而大行其道的就是WPS和微软办公套件(WORD, EXCEL, POWERPOINT等)。在职场上,几乎没人不会用基本的文字处理和电子表格软件,而做汇报的资料基本都需要用PPT来演示。这是工业化时代要求每个人具备的基本工作技能。进入数字化时代,仅仅有这些技能已经不够用了。

我们进入信息时代已经很久了,互联网泡沫在2000年破灭之后,进入了一个稳定发展时期,我们现在面临的不是信息缺乏,而是在海量的信息中如何找到自己需要的信息。而对于分析来说,仅仅分析数字是不够的。随着多媒体快速发展,现在有很多重要信息是以图片、音频、人类语言等形式出现的,这些属于动态非结构化数据,而且数量巨大,因而被称作大数据。大数据呼唤人类的“更强大脑”,目前人工智能技术正在协助为人类赋能,提高对大数据的收集、处理和分析能力。而这些工作都可以用一种计算机语言解决,这就是PYTHON。本文由浅入深介绍几本有代表性的PYTHON工具书。

现在流行的AI人工智能技术大部分都是用Python语言编写的,这种语言与英语相似,“优雅”、“明确”、“简单”,易懂易学,功能强大,而且由于其开放性和扩展性强,可以直接使用大量的外部工具和现成代码,是目前最热门的计算机编程语言。编写计算机代码其实并不需要很高的学历,在IT行业,单纯的计算机编程工作类似于制造企业流水线上的普通蓝领岗位。经过一段时间的学习和训练,很多人都可以掌握编程技能。PYTHON尤其适合普通人学习。《教孩子学编程(python语言版)》是目前一本很受欢迎的入门书。虽然小学生未必适合(至少还是应该达到英语初级水平),但是有初高中文化程度的读者应该很容易入门。里面的例子大多数和绘图和游戏有关,配上程序运行的彩图,大大提高了趣味性。如果之前对其他计算机语言有一定的了解,可以直接阅读本文后面介绍的书。

掌握PYTHON语言,我认为最大而且最基本的用处就是搜集数据和进行数据分析。不同的是,这种语言方便收集和分析大数据,而不像我们以前了解的一些强大的工程计算机语言。应该说,这是一门专门面向大数据的编程语言,而其他功能亦不输javaC这类编程语言。

PYTHON可以和很多已有软件兼容,最强大的功能是人们常说的爬虫功能,一些搜索引擎使用的就是这种技术。爬虫工程师目前是紧缺人才。用PYTHON自己编写专门的爬虫程序,可以爬取图片、自己需要的特定信息,自动去除网页广告等。《精通PYTHON网络爬虫:核心技术、框架与项目实战》是这方面的一本由浅入深的书,从技术、工具、实战3个维度讲透Python网络爬虫各项核心技术和主流框架,深度讲解网络爬虫的抓取技术与反爬攻关技巧。

借助爬虫程序搜集所需大数据,只是我们进行数据分析和数据挖掘的基础工作。在数字时代,我们已经无法满足只是利用数学函数来分析电子表格中的数据了。分析大数据需要懂得一些数据挖掘技术,《Python数据分析与挖掘实战(第2版)》和《Python数据科学:技术详解与商业实践》是这方面较出色的工具书。这些书的一个优点是来自国内资深数据科学专家,在内容的适用性方面更贴近国情,从技术、业务和商业实战3个维度提供了系统化的PYTHON数据分析学习路径,列举的商业案例很有代表性。PYTHON语言的高级应用中,我认为最有用和最有发展前途的是自然语言处理。这是融合计算机、数学和语言学为一体的领域,在语言识别和翻译,语言信息提取、机器与人之间沟通等人工智能应用方面,都是基础和核心技术。能避开抽象的数学和计算机科学基础知识,直接引导读者掌握核心方法的参考书不多,《Python自然语言处理》和《Python自然语言处理实战:核心技术与算法》。前者是入门,后者是进阶。

如今,PYTHON语言几乎成了“网红”语言,网络上也有各种文章和视频教程,几乎每个行业的专业人士都听说过它,似乎炙手可热,有人说这是一门当下必须掌握的技能,这个观点不算太夸张。面对咄咄逼人的人工智能飞速进步,每个人显然都需要进一步提升自身的能力,才能跟得上这个数字时代的脚步。

 

 

 

 

 

 

 

个人简介
宝新金融首席经济学家,香港中文大学(深圳)SFI客座教授,行为经济学者,创新发展,金融投资专家,南开大学经济学博士,荷兰maastricht管理学院mba,兰州大学数学学士 email:prophd@126.com
每日关注 更多
郑磊 的日志归档
[查看更多]
赞助商广告