返回首页
笔记

AI Roundtable @Sspai

少数派的 AI 征集

  1. 请分享一下你目前主要在用的 AI 工具。
  2. (请各用一两句话介绍所提及工具的功能和用途。)

    1. ChatGPT:无需介绍。主要用来体验 OpenAI 各种实验性的新功能以及当前全世界最领先的 GPT-4 模型。
    1. 智谱清言:智谱 AI 推出的面向个人用户 AI 对话工具,对标 ChatGPT,其新上架的 GLM-4 是国内最接近 GPT-4 的模型,可免费体验。作为 MenubarX 的一个固定页面日常使用,省掉 $20 的 ChatGPT Plus 订阅费用,也免于受网络和请求频率限制。
    1. Ollama:轻松玩转本地大模型。用于体验测试各类新品模型及 AI 应用本地开发。
    1. Raycast Ollama:Raycast 插件,既可作为一个 Ollama 前端和模型对话,也能借助 Raycast 提供的系统接口直接读取文件、文本、图片等作为输入,是 Raycast AI 的平替(甚至更强)。用于各类指尖 AI 请求,如选中文本后解释、翻译、检查、改写等,省去频繁的复制粘贴。
    1. Poe:大模型广场。用于体验本地难以部署的模型。
  1. 你每个月在 AI 类工具上的花费大约是多少?是否觉得物有所值,为什么?
  2. $20+,ChatGPT Plus 的订阅(现已取消)及 API 费用。

    GPT-4 作为目前最领先的模型,非常值得一试,很可能体验过就再也不愿用 GPT-3.5 了;但网络和请求频率限制大大影响了体验,同时 GPTs 的生态也远未完善。从普通用户的视角我认为是物有所值的,但作为开发者,为 API 付费可能是更好的选择。

  1. 你一般如何挑选和评估 AI 类工具?
  2. (可以从功能、定价模式、生态、附加服务等角度讨论。)

    有别于普通用户,多数情况下我会更关注其目标需求和功能实现,需求是 AI 应用渗透的观察,实现则作为学习借鉴。通常优选开源工具,生态对于开源工具十分重要,会多关注其兼容性和拓展性、社区活跃度等。

    在核心点的付费上,目前有两大主流类型:a. 软件买断、自带 key,如 MindMac;b. 服务订阅,如 Raycast AI 等。前者如果切中了痛点需求,付费较为值得;后者容易导致订阅碎片化,需要综合考虑。

  1. 你受益于 AI 最多的使用场景是什么?
  2. (请具体对比在该场景下使用 AI 工具前后的工作流程,以及受益于 AI 的具体表现。)

    开发提示。

    前:浏览器 → 关键词 Google ↔ StackOverflow → 理解 → 编写

    后:GPT-4 → 问题 → 答案/代码

  1. 你认为目前限制 AI 工具使用效果和推广普及的障碍都有哪些?
    • 模型能力:许多工具思路很好,但受限于底层模型能力,可能无法达到预期效果;或者某天 OpenAI 推出更新,模型进化,原本工具要解决的问题就不存在了。
    • 工程落地:真实的 AI 开发中,从想法到 demo 也许不难,但从 demo 到应用挑战不小。
    • 行业渗透:只有既懂行业又懂 AI 的团队协作,才能做出真正有价值的行业应用。
  1. 与一年多前 AI 风头刚起之时相比,你对 AI 的认识有了哪些转变?
  2. (可以从对 AI 能力和限制的理解、对「AI 威胁」的看法、对 AI 创作内容的态度等角度讨论。)

    • 刚接触大语言模型时,没想到短时间内以其为基座的视觉等多模态模型就可用,给文本生成类 AI 带来了许多新的想象力。
    • 彼时难以想象,以大模型为代表的这一波 AI 研究,将在安全、道德等方面面临的巨大争议和严峻挑战。
  1. 你认为从个人用户的角度,怎样才算是「负责任」地使用 AI?
  2. (可以从来源披露、使用场景的限制等角度讨论。)

    同时关注 AI 工具的用户协议 和 内容平台的用户协议,在其许可范围内行事。

  1. 目前 AI 模型的研发出现了开源和闭源的明显分野。你更看好哪种路径(或这两种路径应该怎样平衡)?
  2. 闭源模型已经并很可能仍将遥遥领先,作为参照 2022 年训练好的 GPT-4 至今仍无对手,非常可怖。

    但综合考虑隐私、成本、专用性等因素,开源模型的应用渗透大概率会更快,尽管更为分散。

    受限于算力,预计近几年内这样的路径仍将持续下去 —— OpenAI 们验证,追赶者跟随,直到 AGI 到来(?)

  1. 你最期待在 2024 年看到 AI 领域出现怎样的新应用、新能力?
    • 自主智能体,出现若干成熟且大众可用的 Agent 类 killer app。
    • 端侧部署,有一个能力 ≥ GPT-3.5 的模型可以在非旗舰手机上顺畅运行。
    • 具身智能,人形机器人在实验室内轻松完成 80% 以上人类事务。