在这个人工智能和文本到图像生成模型的世界里,我发现自己经常会问一个问题:什么是照片?这是你用镜头和胶卷拍摄的东西吗?还是成像传感器?是相机、人类还是人工智能排列的少数像素?如果后者是真的,那么摄影就远远超出了相机的作用。
认识一下Paragraphica,这是一款由比约恩·卡门创建的相机,它没有镜头,没有传感器,事实上,它根本没有成像技术。然而,Paragraphica拍摄了场景的照片,,它使用人工智能和位置数据来想象你在看什么。
认识一下Paragraphica,这是一款由比约恩·卡门创建的相机,它没有镜头,没有传感器,事实上,它根本没有成像技术。然而,Paragraphica拍摄了场景的照片,,它使用人工智能和位置数据来想象你在看什么。
Paragraphica的“捕捉照片”一词可能有点言过其实,因为它并不能真正捕捉到任何东西。更确切地说,它使用谷歌地图中的位置数据生成照片。Paragraphica可以进入你的位置,在谷歌街景中找到你所看到的相应图像。然后,它使用你一天中的时间、天气以及其他一些参数来运行图像到图像的人工智能模型,并从头开始生成一张新的、异想天开的照片。
相机的功能是通过开放的API从周围环境中收集信息。它考虑了地点、天气、一天中的时间和附近的地标。通过组合所有这些数据点,Paragraphica创建了一个准确描述当前地点和时刻的段落。使用文本图像AI,相机将段落转换为“照片”。然而,这不仅仅是一张普通的快照。生成的图像是位置的复杂而微妙的表示,以及人工智能模型如何感知它。下面是Paragraphica如何组成提示并使用它们生成图像。有很大的空间可以进行各种输入,可以通过相机顶部的三个旋钮进行进一步调整。
卡门说:“有趣的是,这些照片确实捕捉到了这个地方的一些令人回忆的情绪,但以一种不可思议的方式,因为这些照片看起来从来都不像我所在的地方。”
这三个旋钮可以让你控制你的整体输出,就像你在模拟或数字相机上调整光圈、曝光和焦距一样。人工智能相机上的第一个刻度盘的操作非常像相机镜头的焦距,但它不是调整焦点,而是控制相机扫描信息和位置的区域的半径(以米为单位)。另一方面,第二个表盘有助于决定您创建的图像类型。就像在Midjourney中一样,利用种子值为不同的图像风格创造了新的基础。第三个刻度盘控制引导刻度,类似于传统相机中的焦点。增加引导尺度会使AI更紧密地附着在段落上,从而产生“更清晰”的图像,而减少引导尺度则会产生“更模糊”的图像。
Paragraphica这个名字相当有趣,因为它突出了段落到绘画的旅程,同时听起来像照片。该产品也突出了一个相当古怪但美丽的设计。它看起来和感觉都像一台相机,所以你可以立即知道如何握持或使用它。然而,与Paragraphica的不同之处在于明显缺乏相机镜头。相反,设计师卡曼决定在正面制作一个独特的红星形状的盘子。这个细节的灵感来源于星鼻鼹鼠,它在地下生活和狩猎,依靠触手状的鼻子来感知和觅食,而不是眼睛来观察。卡门说:“这种神奇的动物成为了一个完美的隐喻和灵感,说明了从人类的角度来看,对其他智能的移情以及他们感知世界的方式几乎是不可能想象的。”
值得注意的是,Paragraphica(尽管目前只是一个宠物项目)有一些明显的局限性。考虑到它利用了位置数据和街景图像,它与风景的配合效果最好。这意味着Paragraphica不能拍摄人脸、物体甚至建筑物。提示只考虑了环境场景,尽管对人工智能进行一些调整可能会解锁新的功能。目前,Paragraphica相机也只能输出单个方形图像,不能进行视频、全景甚至横向/纵向拍摄。