健雄科协 AI 小组 · 第二期

Claude Code 实战
用 AI 造东西 & 搭 Agent

两条赛道,八个项目方向——你可以做一个在浏览器里跑的可视化应用, 也可以让 Claude Code 变成一个能调用工具、自主完成任务的 Agent。 选一个你感兴趣的,直接开干。

2026 年 3 月 15 日 2 赛道 · 8 个项目选项 约 2 小时 健雄科协人工智能小组

今天要做什么

本期 Workshop 围绕 Claude Code 展开,分为两个部分。 Part 1 把它当成一个「会写代码的搭档」——你描述想要什么,它帮你搭出来, 你们一起迭代,最终产出一个真实可以在浏览器里打开的东西。 Part 2 更进一步,把 Claude Code 当成一个 Agent 的「大脑」—— 给它装上「工具」(比如搜索网页、读写文件、调 API),让它能自主规划步骤、调用工具、完成任务。

每个部分都有 4 个项目方向可以选,找一个你最感兴趣的,跟着思路做就好。 不要求做完所有,做出一个能跑的东西比啥都强

Part 1 — Claude Code 作为编程工具

目标:做一个可视化的、能在浏览器里打开的小应用。不管技术栈选什么,最终要有个能给别人看的界面。

A
通用内容展示页 / Slides
把你的课程作业、小组项目文档、或任何文字内容,变成可直接展示的网页。可以做成单页滚动式,也可以做成 slides 翻页式。
用法示例
  • 课程报告 → 在线展示页(带章节导航)
  • 小组作业文档 → 演示 slides(上下/左右翻页)
  • 社团活动介绍 → 图文混排的宣传页
告诉 Claude Code
  • 「这是我的课程作业内容,帮我做成一个可以展示的网页」
  • 「做成 slides 格式,每页一个章节,支持键盘翻页」
  • 「加一些简单的动画效果,让它看起来像 PPT」
技术栈
HTML CSS Slides
B
AI 推荐类 Web 应用
做一个小型推荐应用——用户输入偏好,应用给出建议。最简单的形态是纯前端,想挑战可以接真实 LLM API。
场景参考
  • 「今天吃什么」饭食推荐器(输入口味、预算、时间)
  • 电影/书单推荐(输入类型、心情、时长)
  • 课程学习路径推荐
界面元素
  • 文本输入框 + 下拉选择器
  • 「生成推荐」按钮
  • 结果展示区(卡片、列表或对话气泡样式)
技术栈
HTML/JS(纯前端) Node.js(可选后端) Python Flask(可选) LLM API(可选)
进阶挑战
  • 告诉ClaudeCode用 数据库 保存历史推荐记录
  • 加更多筛选条件(预算区间、评分门槛等)
  • 接入真实 LLM API,让推荐结果是「活的」(去硅基流动获取API,具体细节问AI)
C
数据可视化小玩具
加载一份 CSV 数据,用图表把它展示出来。让数据「说话」比堆一堆数字更有意思。
数据集参考(随便找一个就行)
  • 个人消费账单(Excel 导出成 CSV)
  • 豆瓣/IMDb 电影评分
  • 模拟销售数据(让 Claude Code 帮你生成一份假数据)
技术栈
HTML + Chart.js SVG React + Recharts D3.js(进阶)
进阶挑战
  • 加搜索 / 筛选器,动态过滤图表数据
  • 让用户上传自己的 CSV,自动渲染图表
  • 加多图联动(点击一个图表,另一个图表联动高亮)
D
AI 表单向导
做一个「智能助手表单」——用户填完偏好之后,应用生成一份个性化计划给他。
场景参考
  • 旅行规划器(目的地、天数、预算 → 行程单)
  • 学习计划生成器(目标、时间 → 每周安排)
  • 健身计划制定(身体情况、目标 → 训练方案)
技术栈
HTML/JS React Python Flask LLM API
进阶挑战
  • 加「导出为 Markdown」或「复制到剪贴板」功能
  • 加「带修改意见重新生成」按钮

Part 2 — Claude Code 作为 Agent 引擎

本期提供四个可直接上手的 Skill 项目:OpenClaw 入门体验 Agent 能力、Bili2Text 部署实践、Claude 搭建深度学习环境,或用 find-skills 自动发现工具构建论文解读 Agent。

Claude Code 的 Agent 能力:Skills + MCP

Claude Code 不只是写代码的工具,它本身就是一个 Agent 引擎。 区别在于:普通 LLM 是「问答机器」,而 Claude Code 可以主动规划、调用工具、持续执行任务。

Demo视频【放弃用了7年的Notion,只因这个AI工作流太香了!|Obsidian+Agent Skills】

Skills(技能)是给 Claude 的「专业培训手册」——放在特定文件夹里的指令和脚本, Claude 会在相关任务时自动加载。比如 Excel 处理技能、品牌规范技能、数据分析技能等。

MCP(Model Context Protocol)是连接外部系统的标准接口——通过 MCP, Claude Code 可以访问你的 Google Drive、Slack、GitHub、数据库等,不需要为每个工具写定制集成。

今天要做的就是:使用现有的 Skills,或创建自己的 Skill,让 Claude Code 成为一个更强大的 Agent

A
从 OpenClaw 入门 —— 体验 AI Agent 的力量
不是重复造轮子,而是以 OpenClaw 为切入点,感受 Claude Code 作为 AI 时代「Agent 入口」的意义,理解 Skills 如何赋予它超能力。并且实现一些定制化能力
为什么要做这个项目?
  • 感受 Agent 入口——Claude Code 不只是写代码,它是你与 AI Agent 对话的入口。通过它,你可以直接「使唤」一个能记忆、能规划、能执行任务的智能体
  • 理解 Skills 的意义——Skills 是 Claude Code 的「超能力扩展包」。没有 Skills,它是普通编码助手;有了 Skills,它是你的专属 Agent
  • 从开源项目中学习——OpenClaw 是一个成熟的开源 Agent 框架,通过借鉴它的设计思路,你会明白一个好的 Agent 应该具备哪些能力
本期目标(精简版 OpenClaw)
  • 自动记忆——让 Claude 记住你的专业、课程、偏好(通过 MEMORY.md 或 Skill)
  • 学期规划——输入课程表,生成完整的学期任务计划
  • 邮件/提醒——定时发送通知、设置任务提醒
现成 Skills 推荐(直接可用)
技术栈
Claude Code Skills MEMORY.md MCP
进阶挑战
  • 用 cron 实现定时提醒(每天早 8 点推送今日任务)
  • 接入多个 MCP,实现跨平台工作流
  • 发布你的 Skill 到 GitHub 供他人使用
B
部署 Bili2Text Skill —— 真正的「即插即用」
一个现成的 Skill,直接下载 B 站视频音频并转文字。代码已准备好,重点是学会「部署 Skills」这个核心技能——以后任何 GitHub 上的 Skill 你都能直接用。
这个 Skill 能做什么
  • 粘贴 B 站链接或 BV 号 → 自动下载视频音频(MP3 到桌面)
  • 需要时 → 自动转录为文字(Whisper 语音识别)
  • 一句话触发:「下载这个视频 BV1xxxxx」或「把 BVxxxxx 转成文字」
如何部署(学会这个,以后任何 Skill 都会用)
  • Step 1:克隆项目到本地(如 ~/bili2text/
  • Step 2:安装依赖(ffmpeg、requests、pydub、whisper)
  • Step 3:将 SKILL.md 放入 ~/.claude/skills/bili2text/ 目录
  • Step 4:告诉 Claude:「使用 bili2text skill 下载 BV1xxxxx」
核心学习点
  • Skills 即代码——Skill 不只是配置,它可以包含完整的 Python 脚本、工具链、自动化流程
  • Claude 是执行器——你描述需求,Claude 读取 Skill 指令,自动调用脚本完成任务
  • 可迁移的能力——今天部署 bili2text,明天就能部署任何 GitHub 上的 Skill
可拓展方向(自己动手增强它)
  • 批量下载——支持播放列表/UP 主所有视频批量处理
  • 智能摘要——转录后自动用 LLM 生成视频内容摘要
  • 多语言支持——识别英语、日语等其他语言的语音
  • 视频下载——不只是音频,连带画面一起下载
  • 数据库记录——记录已下载的视频,避免重复下载
技术栈
Claude Skills Python ffmpeg Whisper Bilibili API
进阶挑战
  • 修改 Skill 指令,让它支持自动识别 UP 主并分类存储音频
  • 打包成一个可分享的 Skill 项目,发布到 GitHub
  • 接入 MCP,让 Claude 自动把转录结果发送到 Notion/飞书文档
C
Claude 帮你搭环境 —— 开启深度学习之旅
想入门 AI 算法但环境配置总出问题?让 Claude Code 这个「有通用能力的 Agent」帮你搞定一切——从租 GPU 到跑通第一个深度学习代码。
为什么需要 Claude Code?
  • 通用能力 Agent——Claude Code 不只是写代码,它能理解你的目标,自主规划步骤、执行命令、解决报错
  • 环境配置专家——装 CUDA、配 PyTorch、处理依赖冲突,你只需要说「我要跑深度学习」,它自动搞定
  • 随时待命——配置出错不用翻论坛,直接问 Claude,它看日志、给解决方案、帮你执行
完整流程(Claude 陪你每一步)
  • Step 1:在 Compshare 平台 注册并租用 GPU(RTX 3090/4090 或更高)
  • Step 2:让 Claude Code 帮你 SSH 连接到服务器,自动安装 NVIDIA 驱动、CUDA、cuDNN
  • Step 3:Claude 部署 Python 环境,安装 PyTorch、配置 Jupyter
  • Step 4:下载 D2L(动手学深度学习) 教材和代码,跑通第一个神经网络
告诉 Claude Code
  • 「我租了 Compshare 的 GPU,帮我配置深度学习环境」
  • 「安装 CUDA 和 PyTorch,要支持 GPU 的版本」
  • 「帮我下载 D2L 教材,运行第一章的线性回归代码」
  • 「这个报错是什么意思?怎么解决?」(遇到问题时直接丢给 Claude)
技术栈
Claude Code SSH CUDA PyTorch D2L Jupyter
进阶挑战
  • 让 Claude 配置一个 Skill,自动记录每次实验的超参数和结果
  • 用 Claude 写一个脚本,自动监控 GPU 利用率并发送报告
  • 尝试用 Claude 辅助理解 D2L 中的数学公式,生成可视化解释
D
AI 论文解读助手 —— 自动寻找 Skills 构建 Agent
先学会「寻找 Skills」这个元技能,然后用它搭建一个自动论文阅读 Agent:粘贴 PDF 链接,自动生成带可视化的详细解读网页。
核心思路:用 Skill 找 Skill
  • 首先部署 find-skills Skill——你只需要描述需求,它自动在 GitHub 上搜索相关 Skills
  • 然后问 Claude:「我要做一个自动读论文并生成网页的 Agent,有哪些 Skills 可以用?」
  • Claude 会返回 PDF 解析、文本摘要、网页生成等相关 Skills,你按需选择
本期目标:论文解读 Agent
  • 输入:粘贴任意论文 PDF 链接(arXiv、Google Scholar、直接链接)
  • 处理:自动下载 PDF → 提取文本 → 分段理解 → 生成结构化摘要
  • 输出:一个美观的网页,包含论文概述、核心方法、实验结果、关键图表解读
告诉 Claude Code
  • 「使用 find-skills,帮我找能处理 PDF 和生成网页的 Skills」
  • 「我要做一个论文解读 Agent,粘贴 PDF 链接就能生成分析网页」
  • 「帮我整合这些 Skills:PDF 解析 + 文本摘要 + 网页生成」
  • 「把这个论文链接转换成可视化的解读页面」
技术栈
find-skills PDF 解析 文本摘要 HTML/CSS Claude Skills
进阶挑战
  • 支持批量处理:输入多个 PDF 链接,生成对比分析页面
  • 添加「关键公式可视化」功能,用图表解释论文中的数学推导
  • 接入 arXiv API,输入关键词自动搜索相关论文并生成综述

最后几点提醒

不要追求完美,先让它跑起来,哪怕功能很残缺。能跑的东西远比漂亮的想法有价值。

卡住了先问 Claude Code,描述你想做什么、现在哪里出了问题、报错信息是什么。 它大多数时候能给你一个可用的方向。

展示的时候不用讲技术细节,说「我做了一个什么、它能干什么、做的过程中遇到了什么有意思的事」就够了。