第200章 绝艺如君天下少
像阿法狗alphago这样的经典人工智能应用。
基本上十个搞人工智能的九个都专门钻研过阿法狗alphago是怎么一回事。
涉及到阿法狗alphago的技术:
无非就是蒙特卡洛树搜索与两个深度神经网络相结合的一个简单应用。
蒙特卡洛树搜索是一种用于某些决策过程的启发式搜索算法,最引人注目的是在游戏中的使用。
在棋类游戏中尤为常见。
具体的两个深度神经网络,其中一个是估值网络,另一个则是走棋网络。
前者是用来评估比较合适的落点的,走棋网络是用来调整最佳落子位置的。
为什么要采用这种设计呢?
很大程度上是受人类棋手下棋的启发。
人类棋手下棋的时候,通常情况下,首先棋手会通过过去的经验、棋谱先大致判断出下哪里不吃亏。
缩小搜索范围之后,棋手会对某一局部位置进行详细的推演。
至于推演时候,棋手主要思考的是自己如何落子、落子之后对手又会如何反应。
一般来说,优秀的棋手都应该具备这种的推演能力。
走一步看十几步甚至几十步,才能成为围棋高手。
计算力的强大与否是衡量棋手中盘能力的重要指标。
至于推演的目的则是是为了找出对自己最有利的落点。
总结一下,优秀棋手要具有一下能力:
首先通过局势判断大概可行走法;
然后判断局势是否对自己有利;
再之后推演局势找出最佳落点。
人工智能虽然看起来是机器方面的学问。
但实际上是科研人员在试图让机器像人那样去思维。
阿法狗alphago在运行的逻辑本质上很接近人类棋手的思考方式。
总之,涉及到阿法狗alphago的技术实现什么的其实不是很复杂。
涉及到技术方面的内容很清晰。
但具体施为起来依旧很麻烦。
首先就是涉及到很多技术底层的东西。
这个时空因为在人工智能方面的东西短腿。
很多理论性的东西还需要从无到有的建设。
换言之,林灰要想重新引爆人工智能这个爆点。
大概率要异时空搬砖,各种搬运人工智能方面的理论知识。
至于具体的搬运还要搞清楚技术路线。
虽然这个工作稍稍有点麻烦,但好在林灰现在多少也是有一个学术工具人的。
技术层面除了人工智能这方面的东西。
还需要一些其它技术层面的东西。
前世,在初代阿法狗alphago里面,谷/歌除了应用了人工智能方面的成果之外。
还应用了一些分布式系统方面的研究成果。
在计算机科学中,分布式计算,又译为分散式运算。
分布式系统是一组电脑,透过网络相互连接传递消息与通信后并协调它们的行为而形成的系统。
虽然像阿法狗alphago这类程序不依靠分布式计算也有着不错的效能。
但分布式计算相比于传统的效率往往更高。
涉及到分布式神马的有点难办。
林灰前世并没有搞过类似的东西。
不过林灰前不久看到谷/歌方面和普林斯顿大学数学系在合作摘要式算法的学报中似乎提到过跟分布式有关的东西。
诚然如此的话,倒不是没机会将涉及到分布式技术的一些东西忽悠过来。
除此之外,阿法狗alphago还涉及到比较麻烦的训练。
如果只是为了不麻烦的话。
林灰没必要非盯着阿法狗alphago不放。
前世又不是只有阿法狗alphago。
阿法狗alphago之后有master,master之后有alpha_zero。
如果说阿法狗alphago还曾负于人类。
alpha_zero则完全是秒天秒地秒空气了。
林灰记得前世看到过的一组数据。
alpha_zero算法只需要8个小时训练后击败对战李世石版本的“阿法狗alphago”。
按照这个说法,意味着alpha_zero的训练成本要远远低于阿法狗alphago。
与前辈阿法狗alphago相比,alpha_zero有很多自己的独到之处。
尽管这个技术很强大,但alpha_zero和阿法狗实际上是有技术代差的。
想要搞出alpha_zero从逻辑层面来说还是要先搞出阿法狗alphago。
这种情况下,林灰觉得技术神马还是尊重客观发展的规律比较好。
真要一步到位的话未必是好事。
能想到阿法狗alphago这个人工智能的爆点已经很不错了。
话说回来林灰早该想到阿法狗的。
林灰记得之前刚注册微博时在微博上蛋疼兮兮地发的那两句话:
——“绝艺如君天下少,闲人似我世间无”
就跟鹅厂的围棋ai有着很紧密的关系。
早点想到这点林灰应该很快就能想到阿法狗。
尽管已经想到了这些。
但涉及到阿法狗alphago的实际复现依旧困难多多。
最大的困难似乎是硬件层面的。
阿法狗alphago还有alphazero这两个技术想问世的话还需要深度学习框架以及硬件方面的支持。
无论是阿法狗alphago还是alphazzro都涉及到前世谷/歌提出来的tensorflow这个深度学习框架。
前世为了这个深度学习框架,谷/歌2016年还开发了张量处理器。
张量处理器(tpu)是谷/歌为机器学习定制的专用芯片。
就特么超级离谱,国内芯片一言难尽。
国外这是人是鬼都在秀。
跟芯片看起来似乎半毛钱关系都没有的也在搞芯片。
说起来初代的tpu规格大致参数林灰是记得一些的。
虽然不是记得特别全。
但林灰还是依稀记得初代tpu是28nm制程。
虽然以林灰的眼光看28nm制程有点糙。
但要知道此时iphone5s上的芯片制程也不过才28nm。
这就很糟心。
也就是说即便林灰能搞tpu,大概率成本也会居高不下。
虽然林灰可以直接利用前世带来的电脑跑模型。
但个人电脑终究会局限一些ai程序发挥效能。
即便在个人电脑上能发挥ai的全部效能林灰也不可能抱着来自往后七年的技术堂而皇之地区面对世人。
哎,难难难。
尽管有这样那样的麻烦。
但提出问题比解决问题更重要。
只要思想不滑坡,办法总比问题多。
相比于这个时代中的人们还在黑暗中摸索着前行。
林灰好歹知道如何解决问题以及解决问题面对的困难。
就这一点妥妥地优势在我!
涉及到这种使用时代最先进技术制程。
似乎不可避免的要涉及到和歪果合作啊。
某积电似乎也看歪果仁脸色。
歪果凭啥拿这种技术资“敌”呢?
说起来搞个歪果的代言公司似乎不错。
毕竟歪果仁蛇鼠一窝。
面对同样的歪果公司芯片制作方似乎不会太大戒心。