数据项目在AI生命周期里的七阶段

AI是当前科技领域中的热门话题,时至今日,企业数据资产及其价值已成为企业经营中的明星业务,无论是业务扩展还是相关数据安全,如何让AI技术在企业数据相关项目中应用最大化则成为当下企业和相关人员兴趣驱动的焦点。

首先,我们要强调一下AI的一个特质:AI不是IT,AI与传统软件在使用也大相径庭,究其根源,在于传统软件往往是确定性的技术,而AI是一项不确定性的、需要考虑概率统计的技术。

我们再来看,在数据中利用AI算法发现价值的过程是一个极具挑战且耗时巨大的工作。虽然一个非技术背景的负责人或执行者在相关项目执行中不必掌握类似如何清理数据、编写Python或是针对算法参数进行优化调整等这样的技术细节,但他们必须清晰理解整个项目过程在各个阶段设定的定义和目标,只有这样他们才能帮助相关业务专家和数据科学家在这个充满实验性质的过程中发现企业业务数据中的最大价值。

目前,国外相关研究已经清楚描述了在AI数据下的七个阶段,但因AI技术的不确定和概率统计等特性,同时企业数据也需经历一个认知过程,因此在数据项目中使用AI技术,再按这七个阶段来执行时往往还需要遵循这样的规律(参照下图):

项目在各个阶段循环速度很快,而且阶段之间经常会有迭代循环操作,为了一个中间结果经常会从一个未完成阶段直接跳到下一阶段,如图所示,项目周期中的步骤1和2(业务理解和数据理解)以及步骤4和5(数据预处理和建模)经常是同时进行而不是串行发生。

下面我们详细分解一下AI数据项目周期中的七个阶段任务:

一、业务理解阶段

目标

确定该数据AI项目的最终业务目标,以及为该项目分配的资源。寻找诸如以下问题的答案:“项目追求的最终结果是什么?”、“AI真的是完成该工作的正确工具吗?”和“这个潜在的AI项目中可衡量的战略价值到底是什么?”等。

挑战

为企业寻找合理且可到达的目标机会,尽量避免因高估AI的能力而好高骛远,企业需要有清晰认识,预想此类项目具有长时的迭代周期以及需为此发挥各种途径建立相关技能和竞争力,这样才能真正将AI技术融入企业日常业务中。

参与角色

高层决策者

首席数据科学家

项目经理

相关业务专家

二、数据理解阶段

目标

确定数据的可访问性和潜在价值,寻找诸如以下问题的答案:“可以利用现有的数据资产就能实现我们定义的业务目标吗?”,或者“使用这些数据是否存在潜在挑战,或者是否有机会以新的方式使用这些数据来实现期望的业务成果?”等。

挑战

从数据中获取最高价值,为了达到这个目的需要相关业务专家和数据科学家一起研究数据,以确定诸如访问数据的方式、如何优化数据以及哪些相关功能可能对最终业务目标具有最高价值。

参与角色

首席数据科学家

项目经理

相关业务专家

三、评估项目资源需求阶段

目标

评估和确定项目成功进行所要求的资源,这个工作可能包括额外的预算、对人员的专门培训、要求相关业务专家加入项目团队、或者需要访问新的数据系统。

挑战

让高层决策者清晰明白实际落地的AI项目存在不可避免的高复杂性和不断变化的需求(尤其是对于那些以前没有类似数据项目的企业的决策者)。

参与角色

高层决策者

首席数据科学家

项目经理

相关业务专家

四、数据预处理阶段

目标

访问、清理和规范数据是数据分析工作成功的关键前提。数据分析团队从该过程中确定与可提取数据的相关特征,以定义在给定可数据源上项目的预期及可行性。

挑战

数据科学家如何与决策者和业务专家讲清楚数据项目的困难/挑战和相关成本,这些挑战和成本通常是巨大的(尤其是在比较传统、之前几乎没有类似数据项目的企业看来)。如果在该阶段得出可以输入的​数据源无论从数量还是质量都不能满足项目需求的结论,则一定要确定该项目不可行。

参与角色

高层决策者

首席数据科学家

数据分析处理团队

相关业务专家

五、建模阶段

目标

在AI模型的数据输入和数据输出之间建立关联关系,对相关数据和算法进行迭代优化以达到项目预期的业务目标。

挑战

核心工作是在数据处理,数据理解和业务理解之间不停循环迭代与优化模型,这里的关键是需要相关业务专家为AI模型的假设和之后的模型训练过程提供精准的建议。

参与角色

首席数据科学家

数据分析处理团队

相关业务专家

项目经理

六、评估阶段

目标

确定我们的数据资产和产生的AI模型是否满足项目设定的预期,这也经常需要在项目周期阶段1、2、3、4或5之间多次反复循环,根据上次结果和预期之间的差距,优化输入数据源、模型及相关参数进行迭代工作。

挑战

因为数据相关项目的衡量标准很难清晰量化,评估阶段是一个巨大挑战,为了确保各阶段能够顺利执行,让高层决策者和相关业务专家积极参与,制定出合理的评估标准并达到预期效果是关键,这样才能更有信心进入项目最终的部署实施阶段。

参与角色

高层决策者

首席数据科学家

项目经理

相关业务专家

七、部署阶段

目标

将AI模型及相关应用程序成功集成到企业现有业务流程中,并以业务效果为最终衡量标准。

挑战

培训企业业务人员高效使用新的AI应用,这是一个不间断维护并优化模型的持续过程以适应业务的不断变化。

参与角色

首席数据科学家

数据分析处理团队

项目经理


最后,需要再强调一下AI数据项目周期中的步骤可以按以上七个阶段顺序进行思考设计,但是在实操项目的部署实施中并不总是严格遵循这样的串行顺序。例如,在数据预处理的阶段,团队可能会发现新问题而采取“退一步”以了解更深刻相关业务,这样就提出了额外的资源需求(譬如密集且及时清理的数据工作,并由此引出更多的人员、时间和其他资源需求);同样,在评估阶段,为了验证结果或者根据项目实际情况,极大可能会在真正部署解决方案之前返回到数据理解等阶段。

资讯网周易六爻摇卦网站优化的价格神秘海域1剧情姓贾女孩起名子算命几斤网站seo优化厂家开个玩具店起什么名广州网站建设多少钱专业技术人员年度考核个人总结免费周公解梦2345原版瑞金市网站建设国际婚庆公司起名符姓起名大全属狗2021年运势及运程每月运程搭建在线教育网站建设seo服务中心算命一般姻缘怎么说淮北算命的地方书店网站设计方案山西网站建设哪家好网站制作需要学什么陈氏起名大全男孩名字大全魔力视频老肉游戏解说精灵宝可梦剑盾seo专业课程李淳罡为什么被困在听潮亭免费qq个性签名观察月亮变化的作文毛姓男孩男孩起名代理seo少年生前被连续抽血16次?多部门介入两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”淀粉肠小王子日销售额涨超10倍高中生被打伤下体休学 邯郸通报单亲妈妈陷入热恋 14岁儿子报警何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言张家界的山上“长”满了韩国人?男孩8年未见母亲被告知被遗忘中国拥有亿元资产的家庭达13.3万户19岁小伙救下5人后溺亡 多方发声315晚会后胖东来又人满为患了张立群任西安交通大学校长“重生之我在北大当嫡校长”男子被猫抓伤后确诊“猫抓病”测试车高速逃费 小米:已补缴周杰伦一审败诉网易网友洛杉矶偶遇贾玲今日春分倪萍分享减重40斤方法七年后宇文玥被薅头发捞上岸许家印被限制高消费萧美琴窜访捷克 外交部回应联合利华开始重组专访95后高颜值猪保姆胖东来员工每周单休无小长假男子被流浪猫绊倒 投喂者赔24万小米汽车超级工厂正式揭幕黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发当地回应沈阳致3死车祸车主疑毒驾恒大被罚41.75亿到底怎么缴妈妈回应孩子在校撞护栏坠楼外国人感慨凌晨的中国很安全杨倩无缘巴黎奥运校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变王树国卸任西安交大校长 师生送别手机成瘾是影响睡眠质量重要因素国产伟哥去年销售近13亿阿根廷将发行1万与2万面值的纸币兔狲“狲大娘”因病死亡遭遇山火的松茸之乡“开封王婆”爆火:促成四五十对奥巴马现身唐宁街 黑色着装引猜测考生莫言也上北大硕士复试名单了德国打算提及普京时仅用姓名天水麻辣烫把捣辣椒大爷累坏了

资讯网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化