我不建议你去学编程,但是我强烈建议你知道怎么看代码,因为在AI时代每天生产量最大的内容就是代码。读代码在以前的确非常痛苦,从但现在不一样了,有AI工具的加持,可以用「 宏观到微观再到找原作者大法」彻底解决这个问题。
需要用到的工具:
AI 编程软件:最佳Cursor+Claude4组合,次之Trae+Claude4,最差也得用Trae+doubao1.5,总之模型越智能越好,Context越长越好(最好在200K以上,1M的最好),后者甚至有时候比前者还重要,因为很多的源代码都挺长的,你得保证模型的记忆足够以及retrieval检索的能力够强。
Github账号:很多的工具都需要你绑定Github账号,否则一切都免谈。
一个能正常收发邮件的邮箱: 很多问题你死活看不懂,或者说按照教程一步步做了但就是不一样,这个时候你可能需要直接给原作者发邮件咨询,因为有可能是源代码本身就有问题(我读博时候遇到过类似的问题,找到原作者才发现的确是写错了)。
01.
宏观会比较笼统
比如你要学Transformer这个算法,你要做的肯定不是从QKV这三个值开始,而是搞明白两件事,一个是input是什么,另一个是output是什么,这个我觉得是最重要的两个点。
比如Input可以是很多种,文字、数字、文件、或者是视频等等,output也一样,这俩首先得搞明白,很多时候就是没看清楚这俩导致白看了半天。
另外知道input/output之后,最主要的是把源代码跑起来,这玩意就跟试物件的手感一样,跑一下首先证明它是对的,其次也能加深对于程序的理解。
怎么跑,首先找README.md,这里通常都会有运行或者使用方法,你照着一步步来就行。
比如就拿Camel的OASIS来说。
但凡作者有点儿职业素养,肯定会有一个部分叫Quick Start/How to run等。
你就跟着一步步来,先试着安装和运行一下。
加入你碰到一个没有什么职业素养的人,那么你可以试试这个网站
https://deepwiki.com/
它背后是AI大模型驱动的,会读取你输入的Repo地址里面内容生成一份详细的使用攻略。
比如它的Get Started会更为结构化,从安装,快速开始,案例等等。
它可以作为一个从整体上了解项目的入口,它里面的这个feature,就是把一些关键的func可视化,然后再附上源代码位置,这个非常省时间。
毕竟看代码看 关键代码就行了。
反正你得起码把overview这个部分给看了,从图形化的角度来了解整个项目的框架。
02.
从微观角度理解每个细分部分
这个小到一个文件,再到一个function,甚至到具体到一行代码的理解。
你可以去下载到本地,然后用一个IDE一点点儿去抠,但是我建议你用AI编辑器,比如Cursor比如Trae,前者你需要点网络技术,后者大家都可以用,并且Trae+豆包1.5在国内几乎算是免费的。
打开Trae后,开启智能体模式,然后问这么一句话:
帮我下载这个repo:到本地,顺便分析这个项目
就这么简单,模型的话,有claude用claude,没条件就用doubao-1.5。
它会帮你自动的下载整个代码到本地,然后进行整体性的分析。
原理倒是不复杂,就是每个文件都看个前50/100/200行,简要的分析下这个文件的大概作用是什么。
然后给你输出一个报告
其实这个跟deepwiki做的东西是类似的,只不过它有一个巨大的好处,那就是它可以细化。
比如你在agents_generator.py上看到这么一个函数,看不懂没关系,你之需要选中它,然后点击添加到对话。
它就被特地取出来放到这个对话框里了,然后再写一句Prompt
给我解释下这个代码
它的优势在于会 参考整个代码repo,因为代码不是孤立的,它可能需要跟很多部件一起生效,而这个function,明显要跟这个py文件一起联动才知道是什么意思。
生成的解释会非常的清楚,即使是新手也无所谓,你可以换个问法。
比如
我是小学生,我看不懂
就是利用大模型非常强的自适应能力来做的,你也可以自定义这个prompt,总之就是让它根据你的水平来解释。
你看这是不是就清楚多了?
这个模式也可以分析一个文件,你可以用拖拽的方式来针对某个具体的文件进行分析。
总之,你用这个方法,不存在搞不明白的代码,只是看你投入的时间多少了。
03.
终极大法:找原作者