被业界誉为“科技圈春晚”的云栖大会日前落下了帷幕, 自研 CPU 芯片倚天 710、自研云原生服务器磐久、第四代神龙架构、全新龙蜥操作系统、“阿里灵杰”等超过 1500 个科技新品和前沿技术亮相本届云栖大会。
其中, 位于云栖小镇 D 馆的一家“数据博物馆”正式“开张营业”, 让众多前来观展的专业观众倍感耳目一新, 纷纷驻足围观体验。
小编实地走访发现, 这家“数据博物馆”是由阿里云天池发起的, 没错, 就是那个“奖金丰厚”、“直通大厂”、“还能结♂识 AI 大神”, 人称“中国数据类赛事第一品牌”的天池平台。
“数据博物馆”在展区内聚集了超高的人气, 吸引了中国科学院国家天文台台长常进院士、创新工场首席科学家周明博士、阿里巴巴集团副总裁贾扬清和阿里巴巴青橙奖获得者王权等学者大咖亲自前往探秘。
那么, 这座“数据博物馆”到底有何玄妙? 下面就跟着我们一探究竟吧!
一座以数据为“展品”的“博物馆”
跟随着拥挤的人流进入这座“数据博物馆”, 就可以看到这里最核心的“展品”—— 行业大规模开源数据集。
数据已成为人工智能时代重要的生产资料, 各个领域的技术开发都离不开数据的支持。但出于商业和安全等方面的考量, 无论是来自不同产业的企业内部, 还是高校和科研机构, 日常积累的宝贵数据都难以真正实现汇总和共享, 难以为技术研发构建坚实的“数据土壤”。
而经过 2.0 品牌升级的天池平台, 则在今年宣布启动了数据集开源计划, 面向全社会开放了上百个行业稀缺的 AI 数据集, 并在“数据博物馆”中进行了展示。
从新零售到天文观测“宝藏”数据一次释出
据了解, 这些在“数据博物馆”里开放展出的“宝藏”数据, 都来自天池平台、阿里巴巴集团各业务团队和外部研究机构合作过程中的积累, 不仅覆盖了电商、娱乐、物流、医疗健康、交通、工业、自然科学、能源等十多个行业, 而且涵盖了数据挖掘、机器学习、计算机视觉、自然语言处理、决策智能等经典的人工智能技术领域。
例如, 在阿里集团最擅长的新零售领域, 基于淘宝直播、拍立淘等电商场景积累的兼具业务挑战和科研价值的脱敏数据已开放给全球开发者。尤其是曾获得中国计算机图形学大会颁发的首个「图形开源数据集奖」, 由阿里淘系技术开源的家居行业数据集 3D-FRONT, 其中包含了超过 20,000 张高清室内场景专业设计渲染图, 极大地填补了业内大规模高质量 3D 场景布局标准数据集的空白。
在工业制造方面, 天池平台也特别开放出了一批来自真实行业场景的数据集, 可用于检测布匹、白酒、瓶盖、瓷砖等产品的瑕疵, 助力研究人员开发 AI 算法来提升生产和质量管理效率。
在自然科学领域, 通过与众多社会机构合作, 天池平台开放的数据集可以用于卫星遥感图像应用、气象预测、天文观察等诸多科研领域……
更厉害的是, 基于这些数据集产出的学术论文, 已经有超过 700 篇。
白天体验奇趣“卡通智绘”晚上还有“围炉夜话”
“数据博物馆”内还有一个由天池平台携手阿里云视频云共同打造的一个别出心裁的卡通智绘体验项目, 现场大排长龙, 人气爆棚, 吸引了超过千名的开发者前来体验。
小编亲身体验发现, 这个体验项目主要通过大量视频图像数据集的 AI 训练, 可以实时将体验者的人像生成出既符合原有特征, 又具有卡通趣味的虚拟形象, 令很多体验者直呼“好看”, 跟自己的卡通虚拟形象合影留念!
晚上, 天池平台还组织了一场让年轻开发者们零距离交流分享的“围炉夜话”。“如何选择第一个工作”、“校招 40 万年薪算不算高”、“AI 的未来发展趋势与行业前景”…… 上百位年轻开发者们在这场名为“天池数据青年团聚”的线下沙龙中畅所欲言, 交流着自己感兴趣的话题, 同时也感受到了天池平台在专注严谨技术赛事外的“温情一面”。
面对新一代技术青年们的好奇与疑惑, 天池平台邀请到了来自浙江大学、杭州电子科技大学两所高校的教授学者, 和阿里星学长、HR 等专家共同组成了导师团, 与年轻人们交流畅谈。
对于大家普遍比较关注的“如何实现学界科研与企业开发无缝连接”等话题, 阿里达摩院的算法专家罗浩表示,“学界和业界只是在不同维度上做研究, 但彼此应该是‘深度绑定’的关系, 学界抛开业界会丢失非常多的研究内容, 业界丢弃了学界, 有很多‘明灯’也是收获不到的。”
为了拉近从高校到产业的距离, 为年轻开发者提供更多的实践机会, 天池平台自成立以来已经举办了 400 多场高规格的数据科学竞赛。有超过 90 万的全球数据开发者, 聚集在天池平台, 在提升自身技术实践能力的同时, 孵化出一系列优秀解决方案, 用以解决行业痛点。
的确, 成立 7 年以来, 天池平台一直伴随着国内外发展趋势不断地“升级迭代”。从立足各行业举办赛事为 AI 人才提供实践机会, 解决不同产业技术难点; 到累计海量数据集, 反哺科研与技术升级; 再到孵化面向 AI 教学的实训平台, 打造良性交流、科普、布道的社区圈层…… 天池平台不仅发展成为了中国最大的人工智能开发者社区, 也在持之以恒地探索和践行着数据众智众创的新模式。
在今年的云栖大会中, 我们看到了“多面”天池的更多形态与可能性。相信在不远的未来, 会有更多的科研数据提供单位加入到天池科研数据集开源计划中, 也会有更多的技术人才参与到天池赛事中去, 共同为中国 AI 产业的长足发展提供源源不断的“动能”。
免责声明:凡本网注明 “来源:XXX(非中国房产新闻网)” 的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。