在当今科技飞速发展的时代,人工智能领域的每一次突破都能在科技圈掀起波澜。国外AI巨头和shopic公司发布的cloud3.5模型再次刷新了整个科技圈。为什么?即它可以将一台普通计算机改造成具有API和通用人工智能的真正的“贾维斯”。
现在你只需要像往常一样告诉计算机一句话,比如“查找下周二至周四从西雅图飞往旧金山的航班”,计算机就会自动打开航班搜索网站,同时还会帮你输入地址和信息。搜索。你想要的航班信息,这不就是现实版的钢铁侠贾维斯吗,真是太神奇了。
但如此强大的“贾维斯”是如何做到的呢?幸运的是,UNSHI已经发布了其实现源代码。我们来看看具体步骤。
项目的成功启动只是第一步。更值得探讨的是它的实现原理。整个项目使用了一个跨平台的桌面应用开发框架——ELE(这里原文可能有错别字,推测是Electron等开发框架)。我们打开SRC文件夹中的主文件夹。这里存放的是Electron应用程序的主流程代码,主要负责创建和管理窗口。 render文件夹中存放的是渲染左上角对应方块的代码。里面的按钮按钮就是页面上的“Let's go”(开始任务按钮)。
当我们点击启动任务按钮时,就会触发“lang代理”方法(这也可能是材料中的特定术语,也可能是“lang代理”等拼写错误),这使得计算机具有Jarvis思维。能力的核心方法。它首先获取用户的聊天内容,然后调用ENOPIC最新的cloud3.5双网模型,具有强大的人机交互能力。之后,模型通过截图的方式获知当前用户的屏幕内容,模型会返回相应的动作指令。这些行动指示非常重要。正是他们将计算机变成了一个可以工作的“贾维斯”。
例如“moss move”命令告诉计算机鼠标应该移动到指定的XY轴坐标位置; “左键杰克”命令告诉计算机右键单击并将当前内容拖动到指定的坐标位置。另外,还有光标位置指令、鼠标左键单击指令、鼠标右键单击指令、鼠标中键单击指令、鼠标双击指令、键盘按键指令等,每条指令执行完毕后,都会重新进行截图,并且cloud3.5模型会得到通知,以便它可以继续发出指令来完成用户的任务,直到最终模型确定任务是否完成。完成后,将返回 FINNISH。该类型的指令表明任务已经完成,整个程序将终止。
怎么样?是不是很有趣?有兴趣的同学可以下载代码,自己开发自己的Jarvis。如果过程中有什么不明白的地方,也可以写在评论区,一起讨论。希望大家能够在编程的探索中有所收获,也别忘了给我点个大大的关注,以便大家了解更多前沿的编程知识。下一期见。
对于贾维斯的发展你怎么看?快来评论区分享你的想法吧。如果您觉得这篇文章不错,欢迎分享给身边同样对编程感兴趣的朋友。
分享到Twitter 在脸书上分享
评论
目前没有任何评论