人工智能与大数据技术实训室文化

作者:电子信息学院(中国高科产业学院) 来源:电子信息学院(中国高科产业学院) 时间:2024-03-04 15:00 点击:567次

人工智能与大数据技术实训室占地110平米,采购由中国高科集团开发的人工智能与大数据硬件和软件平台。人工智能与大数据实训室遵循“校企合作,工学结合”的原则,共建综合业务实训室平台和网络构建实训室,引进2家IT类企业进入学院软件产业园。通过校企共建实训室、引企业入校园等形式,构建了“一体双赢,三合四融”的实践教学格局,实训室能够完成Python嵌入式编程、Python机器视觉应用设计、Python综合应用设计;数据采集、数据分析、数据可视化技能项目;机器学习应用、深度学习应用、数据标注综合案例。教师利用实训平台为学生讲授和演示各种人工智能方面的实例,开设实训项目。实训室达到了“教学做”一体化的条件,整个实训室形成了一个大的、完整的网络平台,构建了“立体化、实时化”的网络教学环境,全面实现了学生学习的“个性化”、“自主化”。同时该室还可以满足我院科研工作和对外服务任务的必要需求。

第一部分人工智能发展史:

1、人工智能的诞生(20世纪40~50年代)

1950年:图灵测试

1950年,著名的图灵测试诞生,按照“人工智能之父”艾伦·图灵的定义:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。同一年,图灵还预言会创造出具有真正智能的机器的可能性。

1954年:第一台可编程机器人诞生

1954年美国人乔治·戴沃尔设计了世界上第一台可编程机器人。

1956年:人工智能诞生

1956年夏天,美国达特茅斯学院举行了历史上第一次人工智能研讨会,被认为是人工智能诞生的标志。会上,麦卡锡首次提出了“人工智能”这个概念,纽厄尔和西蒙则展示了编写的逻辑理论机器。

2、人工智能的黄金时代(20世纪50~70年代)

1966年~1972年:首台人工智能机器人Shakey诞生

1966年~1972年期间,美国斯坦福国际研究所研制出机器人Shakey,这是首台采用人工智能的移动机器人。

1966年:世界上第一个聊天机器人ELIZA发布

美国麻省理工学院(MIT)的魏泽鲍姆发布了世界上第一个聊天机器人ELIZA。ELIZA的智能之处在于她能通过脚本理解简单的自然语言,并能产生类似人类的互动。

1968年:计算机鼠标发明

1968年12月9日,美国加州斯坦福研究所的道格·恩格勒巴特发明计算机鼠标,构想出了超文本链接概念,它在几十年后成了现代互联网的根基。

3、人工智能的低谷(20世纪70~80年代)

20世纪70年代初,人工智能遭遇了瓶颈。当时的计算机有限的内存和处理速度不足以解决任何实际的人工智能问题。要求程序对这个世界具有儿童水平的认识,研究者们很快发现这个要求太高了:1970年没人能够做出如此巨大的数据库,也没人知道一个程序怎样才能学到如此丰富的信息。由于缺乏进展,对人工智能提供资助的机构(如英国政府、美国国防部高级研究计划局和美国国家科学委员会)对无方向的人工智能研究逐渐停止了资助。美国国家科学委员会(NRC)在拨款二千万美元后停止资助。

1997年5月10日,IBM“深蓝”超级计算机再度挑战卡斯帕罗夫,比赛在5月11日结束,最终“深蓝”以3.5:2.5击败卡斯帕罗夫,成为首个在标准比赛时限内击败国际象棋世界冠军的电脑系统。供图/CFP

4、人工智能的繁荣期(1980年~1987年)

1981年:日本研发人工智能计算机

1981年,日本经济产业省拨款8.5亿美元用以研发第五代计算机项目,在当时被叫做人工智能计算机。随后,英国、美国纷纷响应,开始向信息技术领域的研究提供大量资金。

1984年:启动Cyc(大百科全书)项目

在美国人道格拉斯·莱纳特的带领下,启动了Cyc项目,其目标是使人工智能的应用能够以类似人类推理的方式工作。

1986年:3D打印机问世

美国发明家查尔斯·赫尔制造出人类历史上首个3D打印机。

5、人工智能的冬天(1987年~1993年)

“AI(人工智能)之冬”一词由经历过1974年经费削减的研究者们创造出来。他们注意到了对专家系统的狂热追捧,预计不久后人们将转向失望。事实被他们不幸言中,专家系统的实用性仅仅局限于某些特定情景。到了上世纪80年代晚期,美国国防部高级研究计划局(DARPA)的新任领导认为人工智能并非“下一个浪潮”,拨款将倾向于那些看起来更容易出成果的项目。

6、人工智能真正的春天(1993年至今)

1997年:电脑深蓝战胜国际象棋世界冠军

1997年5月11日,IBM公司的电脑“深蓝”战胜国际象棋世界冠军卡斯帕罗夫,成为首个在标准比赛时限内击败国际象棋世界冠军的电脑系统。

2011年:开发出使用自然语言回答问题的人工智能程序

2011年,Watson(沃森)作为IBM公司开发的使用自然语言回答问题的人工智能程序参加美国智力问答节目,打败两位人类冠军,赢得了100万美元的奖金。

2012年:Spaun诞生

加拿大神经学家团队创造了一个具备简单认知能力、有250万个模拟“神经元”的虚拟大脑,命名为“Spaun”,并通过了最基本的智商测试。

2013年:深度学习算法被广泛运用在产品开发中

Facebook人工智能实验室成立,探索深度学习领域,借此为Facebook用户提供更智能化的产品体验;Google收购了语音和图像识别公司DNNResearch,推广深度学习平台;百度创立了深度学习研究院等。

2015年:人工智能突破之年

Google开源了利用大量数据直接就能训练计算机来完成任务的第二代机器学习平台TensorFlow;剑桥大学建立人工智能研究所等。

2016年:AlphaGo战胜围棋世界冠军李世石

2016年3月15日,Google人工智能AlphaGo与围棋世界冠军李世石的人机大战最后一场落下了帷幕。人机大战第五场经过长达5个小时的搏杀,最终李世石与AlphaGo总比分定格在1比4,以李世石认输结束。这一次的人机对弈让人工智能正式被世人所熟知,整个人工智能市场也像是被引燃了导火线,开始了新一轮爆发。

第二部分大数据发展史

萌芽期(1980年-2008年):大数据术语被提出,相关技术概念得到一定程度的传播,但没有得到实质性发展。同一时期,随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识管理技术开始被应用,如数据仓库、专家系统、知识管理系统等。1980年,未来学家托夫勒在其所著的《第三次浪潮》一书中,首次提出“大数据”一词,将大数据称赞为“第三次浪潮的华彩乐章”。2008年9月,《自然》杂志推出了“大数据”封面专栏。

成长期(2009年-2012年):大数据市场迅速成长,互联网数据呈爆发式增长,大数据技术逐渐被大众熟悉和使用。2010年2月,肯尼斯·库克尔在《经济学人》上发表了长达14页的大数据专题报告《数据,无所不在的数据》。2012年,牛津大学教授维克托·迈尔·舍恩伯格的著作《大数据时代》开始在国内风靡,推动了大数据在国内的发展。

爆发期(2013年-2015年):大数据迎来了发展的高潮,包括我国在内的世界各个国家纷纷布局大数据战略。2013,以百度、阿里、腾讯为代表的国内互联网公司各显身手,纷纷推出创新性的大数据应用。2015年9月,国务院发布《促进大数据发展行动纲要》,全面推进我国大数据发展和应用,进一步提升创业创新活力和社会治理水平。

大规模应用期(2016年至今以及以后):大数据应用渗透到各行各业,大数据价值不断凸显,数据驱动决策和社会智能化程度大幅提高,大数据产业迎来快速发展和大规模应用实施。2019年5月,《2018年全球大数据发展分析报告》显示,中国大数据产业发展和技术创新能力有了显著提升。这一时期学术界在大数据技术与应用方面的研究创新也不断取得突破,截至2020年,全球以“big data”为关键词的论文发表量达到64739篇,全球共申请大数据领域的相关专利136694项。

中国大数据发展史

大数据1.png

第三部分人工智能综合实训流程

基本流程

1.获取数据

2.数据处理

3.特征工程

4.机器学习

5.模型评估

5.1 结果达到预期要求使用

5.2 结果没达到预期要求重新调整参数训练

基本流程详解

获取数据

数据采集方式(爬虫、自己网站、app埋点、购买数据、通过数据服务商)

数据处理

无量纲化

对定量特征二值化

对定性特征哑编码

缺失值计算

数据变换

特征工程

Filter

方差选择法

相关系数法

卡方检验

互信息法

Wrapper

递归特征消除法

Embedded

基于惩罚项的特征选择法

基于树模型的特征选择法

降维

主成分分析法(PCA)

线性判别分析法(LDA)

机器学习

读取数据

开始训练

可以联机学习

可以分段学习

保存模型

评估

模型评估

主要参数

召回率

覆盖率

其他指标

第四部分大数据分析综合实训流程

大数据2.png

图1:商务大数据应用实训流程图

31100bf6675d8e95cb9ef71347f2aa7e.jpg

图2企业大数据实训流程图