51客服

钢铁工程师怎么看待人工智能

2023-12-30

前言:回顾二十几年的职业生涯,一个干钢铁的,从操作、质检、性能、合同、异议、自媒体科普、知识管理,最后转行人工智能。虽然做过很多工作,但在我内心深处,其实还是有着深深的工业情节。


那么从钢铁工程师的角度,对人工智能领域总结一些个人理解,欢迎大家提出不同的意见,互相交流、互相印证。


人工智能三要素


数据、算法、算力,是人工智能三要素,三者缺一不可。本质上,做人工智能项目就是根据本公司在这三要素上的资源储备,平衡优化,给出一个性价比最高的解决方案。


三要素是必要条件,缺一不可。三要素存在木桶短板效应,最短的那块板子决定了整个项目的上限。当然,也有互联网营销中常说的木桶长板效应——只要你在三要素里有一块长板,就可以和其他公司的长板合作,做一个大木桶。


但是,前提是你得有一块长板。很多公司以为自己有,其实并没有。


我们用工业领域的逐层解析的思维,用“剥洋葱”的方法,一层层分析,看看“人工智能”这颗洋葱是不是会让我们泪流满面~


算力——花钱就能搞定?


算力的升级是现代人工智能技术的先决条件,因为算力提升超过一定的阈值,使得大数据灌入并应用复杂的算法在有限的时间内计算出结果得以实现。


但是,算力其实是有穷尽的。毕竟,普通的商业公司不像谷歌、清华这些行业领军者,可以拿着几亿几十亿的资金去做预训练和后续的一系列应用。


所以,对于普通的商业公司来说,我们现实一点:一块12G显存的英伟达特斯拉K40显卡能不能完成模型训练并且在预估的时间内跑通少量并发的预测任务完成DEMO?


如果可以,那这个项目大体可控;如果不行,那也许这个项目的可控性是存疑的。或许算法选择不当、或许预处理效率不高,或许数据基础太差等等~这些底层的基础环节失控才会导致对算力无法做出准确评估。


我本人的经验:以中文NLP实体抽取为例,在配置十代桌面i7芯片的电脑上,能不能六小时内完成训练(用CPU可以随时评估,不受限于GPU服务器。),能不能在30秒内完成千字左右的单次小样本预测。


如果可以,那这个项目对算力的需求是大体可控的。既然能控住算力需求,想必对项目的整体框架也是心中有数的。


算力就是水电煤,是能源,是动力。


算法——常被误解为是数学问题


从工业应用的角度来看,算法的通俗理解是“满足业务需求的逻辑”,算法是服务于业务需求的。


算法本质上是把业务流程进行高度抽象之后进行范式转换,然后再用数学方法运算,最后用于高效解决实际问题的工具。


所以大家发现重点没?要设计算法,首先得有业务抽象能力。没有业务抽象能力无法设计出“满足业务需求的逻辑”,在人工智能领域,算法不应当是一个单纯的数学概念。


既然算法设计是个偏业务类的工作,那么在工业领域的人工智能项目中,设计算法最强的是谁?当然是“有一定IT知识的业务专家”,也就是前几年传统行业里说的“数字化人才”。


那么在人工智能领域中数学家做的是什么?个人理解数学家的核心价值是设计运算模组,也就是业务算法和机器算力的中间层,是我们常常提到的BERT模型、W2V模型等等。


这些模型把业务抽象的逻辑算法进行再度的抽象,制造出一种普适性的、高效的”运算模组“。他是算法调用的一个运算模块,但不是算法本身。


算法是什么?算法是轧机、是退火炉。

运算模组是什么?是马达、是离合器。


数据——你以为“有”,其实“并没有”


数据的完整称呼应当是“可被算法用于计算的数据”。垃圾数据能计算么?不能,所以垃圾数据只是字节。


顺带一提,因为对于数据的定义产生了误解,很多公司对于数据资产也产生了误解。什么是资产?是预期会给企业带来经济利益的资源。不能带来经济利益的资源不能作为资产,只是企业的权力,拥有这些字节的权力。


评估一个企业是否拥有数据,要看拥有的是一堆硬盘中保存的字节,还是分门别类,代码化管理,规则清晰,结构合理的,“可被算法高效运算并产生经济利益“的数据。


除此之外,如何获取和加工数据是一个重资产的话题。积累数据资产不可能空手套白狼,必须投入大量人力物力。更高层次的行业知识数据的获取更是一个知识密集型的工作,不是行业头部的公司恐怕做不了。


数据是生产原料,就像澳洲铁矿、巴西铁矿、或是印度铁矿。从综合成本的角度来看,投入产出是要平衡的,还没有听说有哪种一种技术可以低成本地从垃圾中炼出金子(开发这种技术本身就是个重资产投入)


算法+算力+数据=生产线


算法+算力+数据,就形成了一条可以生产的生产线,就像冷轧产线、热轧产线、退火产线。


这些产线串联起来,就是一个工厂:


钢铁工厂:高炉/电炉——连铸/模铸——热连轧/厚板单轧——酸洗冷轧——连退/罩退/热镀/电镀。


人工智能工厂:语音/CV/OCR——NLP/规则模型——知识图谱/SQL库——应用功能模块。


结语


在这一轮互联网+的人工智能大潮之前,钢铁、电力、化工等行业其实都已经做了大量的探索和基础工作。或许受限于工业体系技术成熟,设备更新周期较长等原因,所以工业智能软件的迭代没有互联网行业那么快。


但是这并不意味着工业领域的人工智能基础薄弱,反而是在基础数据的规范体系建设、在如何结合现场设备压榨算力等方面,工业领域做的非常出色。


以计算机视觉识别技术为例,其实钢厂二十年前就在使用了。即使当年计算机算力低下,但工业领域的工程师仍然通过规范输入信息(固定距离、流明等参数)+领域专家高质量标注,通过大系统设计的思维,使得300米/分钟的高速产线的视觉识别得以实现并稳定应用。


工业生产对准确性和稳定性要求非常高,一些从互联网领域发展起来的人工智能技术或许很难短期快速的进入工业生产的领域,但是在工业的管理和服务等领域人工智能技术还是可以有很大的发挥空间。


比如使用NLP(自然语言处理)技术用来读取质量异议文档,自动转成表格化数据,然后减轻人工整理的工作量,便于统计分析和质量管理。


或是使用NLP技术对工业领域的知识文档进行知识抽取,并用知识图谱技术做底层的关系结构,用于钢厂技术文稿、档案、知识库的管理,提供技术资料的快速检索也是可以探索的。


至于知识图谱技术,它在流控方面具有天然优势,用来做制造部排产优化、质量异议的产线排查、质量缺陷传导分析等方面理论上也可以带来更高的能效。




-END-




上一篇:绿色钢材:“低碳钢”和“零碳钢”
下一篇:暂无