被《硅谷》选中的“压缩算法”,为什么说下一个机器学习杀手行使将由此诞生

吾将这一技术归类到压缩手段中的因为是你能够经历生成性的神经网络将字幕还原为图像。尽管重复活成的图像不会跟原图像十足相反,但也能够从原图像继承一些新闻。倘若你期待终局与原图像尽能够挨近,你也能够从风格化方面考虑,例如为每个场景生成简图。这些技术的共同特征在于他们挑掏出了输入文件中对于吾们人类主要的片面,并省略了余下的片面。

不光仅是图像

这也是吾认为机器学习能够在这个周围取得重大突破的因为之一,由于制造商已经拥有特意用于视频和音频压缩的工程师、资金和芯片。倘若吾们能够表明将机器学习增补到现有解决方案中能够以一些可度量的手段(例如质量、速度或功耗)改进它们,那么它们将被快速采用。

当然,益新闻是现在吾们已经有了一些硬件解决方案,比如Edge TPU等,能够让吾们望到异日达到更多计算量的能够性。吾憧憬这栽压缩手段能够行使到各栽类型文件的压缩转换上,从视频到图像,到音频,乃至更多足够想象力的手段。

现走的大无数CPU每秒仅能处理百亿级的运算,而在高清视频上用机器学习进走压缩很容易便能达到十倍于此的计算量。

移动互联网时代,人类生产的新数据正以指数级别添长,数据中间越来越大,并消耗着地球上不走思议的重大能耗,但人类照样能够面临着“数据无处存放”的境地。

OSDI上的一篇文章“神经自体面型内容感知互联网视频传输”激发了吾对这一周围的趣味。

上文所挑到的一切手段都必要相对较大的神经网络,并且所需的计算量与像素数目成正比。这意味着大型图片文件或每秒帧数较高的视频文件能够必要比现在普及操纵的移动设备更强的计算能力。

很多激动人心的钻研外明这栽手段将会特意高效,而且吾笑不益看地认为还有很多行使尚未被挖掘。吾期待机器学习在压缩中的行使将发展成为一门核心技术。

神剧《硅谷》剧组就选中了这个点子。在剧中,几个主角的得以创业成功的核默算法——“魔笛”即是选中了“压缩”这一无数人都能理解但对技术请求颇高的周围:批准用户在线将图片压缩至一半的大幼,并照样保持其清亮度。

最近机器学习在当然说话处理中取得了大量兴味的收获。这是另一个让吾觉得机器学习是较为优厚的压缩转换途径的因为。

“魔笛算法”也一度引发了不少跟风打造属于本身的“魔笛手”,此外,包括谷歌等人造智能巨头公司近年来也在这个周围一再发力。

在吾创业期间,营销战败的经历让吾学到了一件事:倘若已经有一笔预算要购买你所倾销的产品,该产品的出售会容易得多。预算的存在意味着公司在是否答该花钱购买解决方案上已经赢得了艰难的搏斗,现在唯一的题目是购买哪栽解决方案。

尽管引来这样高的关注,但很多人照样不认可它会在异日的发展中取得压服性的上风。谷歌的RAISR算法也被不益业内意识吐槽说“压缩一张图片耗时久”、“压缩后图片清亮度异国那么高”等等。

当然说话是最后压缩现在的

倘若你稍稍不益看察,便会发现字幕其实是将声音压缩为图像的一栽形态。吾不息想做一个项现在,试图创造出一栽相机,每秒生成一帧字幕,并将一切字幕一一按走输出至一个日志文件中。由此便可浅易记录下基于相机的拍摄内容随时间的推移而发生的故事,这能够被定义为一个叙事类的传感器。

2016年,谷歌有关团队推出了一款叫RAISR(Rapid and Accurate Image Super-ResoluTIon)的图像压缩技术。期待以人造智能技术行为压缩路径,将图片大幼压缩到源文件的1/4, 但基本不会转折图片的清亮度。

文章链接:

这篇文章通知吾们:经历神经网络,在带宽相通的条件下,用户体验将能挑高43%,或者在带宽削减17%的条件下能够保持体验的质量基本不变。还有其他同类的论文将相通手段行使在了生成压缩或自体面图像压缩等方面。他们都展现出了惊人的收获。那么,为何吾们不把机器学习更普及地行使在文件压缩方面呢?

说话世界也有相通的趋势。语音识别正在快捷改进,相符成语音的能力也在快捷挑高。识别能够望作是将音频压缩为当然说话文本的过程,而相符成则正好相逆。你能够想象将对话高度压缩为当然说话文字而非音频。诚然,吾们不必要达到那栽请求,但益像经历扩展吾们对于外达的认知类型,吾们能够实现在矮带宽情况下的更益的终局。

谷歌机器学习工程师、Jetpac创首人Pete Warden近期发布了一篇文章,认为在短期内压缩算法能够会成为机器学习行使最能够展现的杀手级行使的周围,他从“压缩”这一技术的首源最先,期待通知行家问什么压缩技术的前景是这样的汜博。

https://www.usenix.org/conference/osdi18/presentation/yeo

吾甚至还发现一些兴味的将机器学习行使在文本本身上的能够性。Andrej Karpathy的CHAR-RNN(递归神经网络)展现了神经网络对某些模板进走模仿的优厚性,而对于压缩技术来说,展望也是相通的道理。考虑到清淡的HTML页面有不少冗余,这一情况下GZIP压缩手段益像有很大机率能被机器学习改进,尽管吾认为这异国机器学习对文本的处理那么容易。

本文首发于微信公多号:大数据文摘。文章内容属作者幼我不益看点,不代外和讯网立场。投资者据此操作,风险请自担。

吾们尚未拥有性能配套的计算设备

大数据文摘对这篇文章进走了编译。

对于压缩的钻研已立项拨款

所以,让文件变幼一点,这绝对是个值得投资的点子。

带宽将会消耗用户和运营商的大量的成本,质量和电池寿命将会成为产品的卖点,所以采用机器学习改进压缩的上风将比其他行使更为显而易见。

热点文章
近期更新
友情链接

Powered by 白姐加大 @2018 RSS地图 html地图