绿色小软件下载
当前位置:首页 >> 业界风云 >> 具有视觉功能的免费开源 ChatGPT 替代方案:LLaVA

具有视觉功能的免费开源 ChatGPT 替代方案:LLaVA

比尔·盖茨 业界风云 2

LLaVA 是一个具有视觉功能的开源 ChatGPT 替代品。这是一个开源 LLM,您可以在本地运行。或者您也可以在 Google Colab 中运行。它可以在类似聊天的界面中回答您的所有问题,就像 Llama 2 等其他 LLM 一样。但这里最好的部分是它还可以读取图像。从您那里拍摄图像后,它可以告诉您它是什么,然后您可以进一步询问有关该图像的问题。如今,法学硕士变得越来越先进。开源社区每天都在发布不同的模型。最近,这个 LLaVA 在 GitHub 上上线了,而且非常强大。如果你有一个功能强大的硬件,那么你可以在本地运行它并询问它任何问题。它可以回答您与任何主题相关的问题,无论是技术、历史还是常识。它可以是您自己的个人人工智能助手,您可以免费使用。在下面的帖子中,我将讨论它的一些主要功能以及如何部署它。LLaVA 的主要亮点:以下是该 LLaVA 模型的 4 个主要亮点。LLaVA 可能是他第一次尝试使用纯语言 GPT-4 生成多模态语言图像指令跟踪数据。LLaVA 是大型语言和视觉助手的首字母缩写词,是一种端到端训练的大型多模态 AI 模型,结合了视觉编码器和 LLM,用于通用视觉和语言理解。LLaVA 表现出卓越的多模式聊天能力。有时它甚至会在看不见的图像上表现出多模态 GPT-4 的行为。LLaVA 团队将 GPT-4 生成的可视化指令调整数据、我们的模型和代码库公开。如何在 Google Colab 上免费安装 LLaVA?尽管如此,您也可以按照其 GitHub 存储库上给出的说明轻松下载和安装 LLaVa。我相信不是每个人都有能力流畅运行它的硬件。因此,要安装它,您可以使用 Google Colab,我稍后将提到如何做到这一点。转到此 GitHub 页面,然后单击第 4 个链接,即:LLaVA_7b_8bit_colab 7B它会将您带到 Google Colab,您只需确保已登录即可。它会像这样打开。现在,您需要通过单击播放按钮来运行第一个单元格。现在需要一些时间,并且会自动为您收集和设置依赖项。在这样做的时候要有耐心。同样,运行所有单元格并等待该过程完成。当您运行最后一个单元格时,几秒钟后,您将看到 Gradio 链接。单击 Gradio 链接,在新选项卡中,如果 LLaVA 将打开 Web UI,如下所示。现在,您已经在 Google Colab 上成功运行了 LLaVA。只需按照下一节了解如何使用它来获取问题的答案并阅读图像。如何像 ChatGPT 一样使用 LLaVA LLM?现在,当您拥有 LLaVA 的类似聊天界面时,您就可以开始使用它了。但在此之前,我建议您先配置一些参数。展开参数部分并配置温度、Top P、最大令牌等。现在,您可以简单地开始聊天。您可以提出简单和复杂的问题,它会为您解答。它会自动理解上下文,然后需要一些时间才能吐出答案。你可以问任何你想问的。它还可以生成很长的答案。针对不同的主题向它提出一些复杂的问题。例如,您可以询问它在 Arch Linux 上安装 Open box 的过程,它会给您一个正确的答案。以类似的方式,您也可以上传图像,然后输入提示。它将分析两者,然后相应地生成答案。它的视觉非常强大,可以快速识别图像中的物体和整体上下文。通过这种方式,您可以根据需要进行对话。您可以清除聊天,然后使用新主题和问题再次开始聊天。但是,我在聊天中没有看到指定系统角色的选项。因此,我希望该项目的开发人员和贡献者考虑在下一次更新中添加它。?。。。您是否正在寻找可以在 PC 或云上免费轻松运行的个人 LLM?那就别再看了,因为 LLaVA 就是您正在寻找的工具。不,无论您是学生还是研究人员,此工具都会为您提供帮助。按照我在这里解释的那样尝试一下,你就可以开始了。如果您对它的来源和更多技术细节感兴趣,那么您可以继续查看它的 GitHub 存储库。

具有视觉功能的免费开源 ChatGPT 替代方案:LLaVA

协助本站SEO优化一下,谢谢!
关键词不能为空

免责声明

本站有部分为网络搜集整理而来, 如有版权及内容质疑,请即刻联系站长整改。分享是美德,欢迎转载,敬请注明出处

同类推荐
控制面板
您好,欢迎到访网站!
  查看权限
标签列表