最新研究用“光”生成图像:瞬间生图,几乎0功耗,效果在线!

     分类 [Ai资讯]
2025/9/1 13:43:45 浏览量  324 喜欢  4
导读:OpenAI 曾公开数据:仅一周,他们的某个图像生成器就输出了 7 亿张图片。想象一下,这背后是多少机房加班加点地工作,耗电量堪比一个小城市

最新研究用“光”生成图像:瞬间生图,几乎0功耗,效果在线!

生图模型一个接一个上线、功能越来越花哨、我们一次次生成精美的图片...... 这背后正烧掉无数电力和冷却用水。

OpenAI 曾公开数据:仅一周,他们的某个图像生成器就输出了 7 亿张图片。想象一下,这背后是多少机房加班加点地工作,耗电量堪比一个小城市。

可就在大家都以为关于AI的能源危机越来越严重的时候,一群科学家说:

你相信光吗?

最新研究用“光”生成图像:瞬间生图,几乎0功耗,效果在线!

 

传统的扩散模型(Diffusion Model)是怎么画图的呢?

它得先学会“拆图”,把一张张图像用噪声搅成一锅粥,再从这锅里一步步“拨乱反正”,直到还原出一张匹配文字描述的清晰画面。这中间可能需要上千步运算,每一步都耗着 CPU、GPU 的电。

最新研究用“光”生成图像:瞬间生图,几乎0功耗,效果在线!

在加州大学洛杉矶分校的实验室里,Aydogan Ozcan教授和他的团队提出了一个大胆的想法:为什么一定要用电子来计算呢?为什么不能用光?

简单来说,他们只用一个浅层的数字编码器,把随机噪声转换成“相位图案”,再交给一块空间光调制器(SLM)印到激光上。激光一闪,图像“啪”地一下就出来了。

最新研究用“光”生成图像:瞬间生图,几乎0功耗,效果在线!
实验演示

这样做的好处是,只有数字编码器需要消耗少量能量,而整个解码过程完全由光来完成,不需要任何计算功耗。

传统扩散模型需要上千步迭代,烧电如开水壶。而光学扩散模型是快照式生成,几乎零功耗。

有一个学者给了一个更形象的比喻:就像电热水壶“烧水一秒钟”与“跳闸前的几百万分之一秒”的能耗差距。

 

用光生成图像这事,听起来确实挺玄,也不太好理解。

其实成果已经摆在那儿了。团队用这套光学模型生成了:手写数字(MNIST 数据集)、时尚单品(Fashion-MNIST 数据集)、蝴蝶翅膀、人脸(Celeb-A 数据集),甚至还有梵高风格的画作。

最新研究用“光”生成图像:瞬间生图,几乎0功耗,效果在线!

效果呢?和主流扩散模型生成的图像几乎一个水平。

而且,这玩意还有两种模式:

  • 快照式光学生成:激光一扫,图像即现。速度瓶颈不是算法,而是屏幕刷新率。

    最新研究用“光”生成图像:瞬间生图,几乎0功耗,效果在线!

  • 迭代式光学生成:像光学版的扩散模型,一步步从噪声中“擦亮”图像。

    最新研究用“光”生成图像:瞬间生图,几乎0功耗,效果在线!

 

Ozcan认为它可能会在可穿戴电子产品中找到用武之地,比如说AI眼镜。

而且这种光学模型还有一个特殊的能力:隐私保护

因为在这种方案中,单个由随机种子生成的编码相位图案在不同波长下被照明,只有正确配对的衍射解码器才能准确重建并揭示相应波长通道中的预期信息。

说人话就是:一把钥匙配一把锁

对你展示的是梵高的《星空》,对别人可能只是一堆无意义的噪点。

一群人坐在一起,每个人都能通过自己的“光钥匙”看到专属内容。学生看到课件,设计师看到设计图,老板看到财务报表

所有信息都来自同一束光,但互不干扰。

这种保密性是物理级别的安全保护,几乎不可能被黑客破解。

最新研究用“光”生成图像:瞬间生图,几乎0功耗,效果在线!

 

光学生成模型的意义,不只是省电这么简单,它揭示了更大的趋势:

  • 算力不再是唯一解:英伟达固然牛,但世界不可能永远靠堆 GPU 解决问题。未来的 AI 创新,可能要和物理、光学、生物技术结合。

  • AI的“去中心化”:如果 AI 真能跑在一副眼镜上,甚至靠自然光完成生成,那意味着个人设备也能享受顶级算力,不必依赖云端机房。

  • 新的商业竞争格局:谁能率先把“光学生成”商用化,谁就有可能绕过算力垄断,改写产业格局。

当大家还在为显卡抢破头时,也许那道穿过激光片的光,已经默默照亮了 AI 的未来。

 

标签

微信扫一扫,分享到朋友圈

微信公众号
 苹果iOS虚拟币充值(抖音钻石、快币、薯币、比心币、他趣币、陌陌币充值)

相关推荐