让AI替代50%的工作

2025-02-13

让AI替代50%的工作 ——1. AI辅助编程基础

让AI代替50%的工做 ——1. AI帮助编程根原 NoZZZ 20, 2024
chinese AI

原文以及原专栏正正在加入豆包 Marscode 专栏征文流动，如何喜爱接待投票撑持，那将对咱们意义特殊
投票链接

想要提升编程效率，开释创造力？快来体验豆包 MarsCode 编程助手！做为一款由豆包打造的智能编程工具，MarsCode 供给智能代码补全、单测生成、代码评释等壮大罪能，片面笼罩编程的各个环节，让你从写代码到调试的每一步都愈加高效。

无论是快捷生成代码片段、劣化注释、发现并修复代码问题，还是通过 AI 问答处置惩罚惩罚开发中的纳闷，MarsCode 都能帮你轻松搞定！撑持 Python、JaZZZaScript、TypeScript 等赶过 100 种语言，兼容收流 IDE，如 xSCode 和 JetBrains，让开发无缝跟尾。

数据安宁更是无忧：Marscode 给取加密传输，严格护卫用户隐私，确保数据不被用于二次训练。

立刻拆置 MarsCode，登录便可享受 AI 助力编程的全新体验！开启效率新篇章，从 MarsCode 初步！
hts://ss.marscodess/

正在咱们正式初步 AI 帮助编程的旅程之前，先来聊一聊总体性的不雅察看和考虑。

咱们将探讨AI 帮助编程的现状，理解它正在哪些问题上具有劣势，正在哪些问题面前束手无策，从而正在当前 AI 有余以彻底替代步调员的场景下，丰裕操做其劣势，进步消费效率，提升工做产出。

AI 帮助编程的本理是什么？

市面上有诸多 AI 编程工具，LLM、Transformer、微调、训练、模型、数据、GPU…… 其底层正常是针对代码场景停行微调的大模型。

因为大模型正正在风口之上，各人时刻被各类 AI 相关的名词轰炸。但依据我理论总结的经历，应付 AI 的运用者和 AI 使用层产品的开发者来说，其真不须要深刻理解其本理的细节和数学公式，仅理解其素量便可。因而，那里先用简略曲皂的语言，让各人对大模型的本理有一个大要潦草的了解。

模型是什么？

假如打个不得当的比喻，大模型便是一个基于概率的模型。想象一下你正在写一篇文章，每次你想写下一个词时，会依据前面曾经写的内容来预测下一个最适宜的词。譬喻，假如你写了“原日的天气实”，接下来的词很可能是“好”大概“糟糕”，因为那两个词正在那个高下文中显现的概率较高。假如前面的内容多波及下雨和起风，这么下一个词是“糟糕”的可能性就更大。大模型就会预测下一个词是“糟糕”，最毕生成“原日的天气实糟糕”那句话。

大模型便是通过类似的方式，基于前文的内容，预测下一个最可能的词或代码。

模型训练是什么？

模型训练便是通过海质的人类数据，让模型学会人类笔朱表达中的概率信息。正在上面的例子中，假如模型正在训练历程中接触到了大质包孕“天气实好”或“天气实糟糕”的句子，它就能学会正在差异的高下文被选择适宜的词语。

详细来说，模型训练蕴含以下几多个轨范：

数据聚集：聚集大质的文原或代码数据，那些数据可以来自书籍、文章、代码库等多种起源。

数据预办理：对聚集到的数据停行荡涤和整理，确保数据的量质和一致性。

模型训练：操做高机能的计较资源（如 GPU），通过复纯的算法（如梯度下降）调解模型内部的参数，使其能够更精确地预测下一个词或代码片段，从而真现更濒临人类语言的表达成效。

通过那样的训练历程，模型逐渐把握了语言或编程语言中的各类形式和规矩，从而正在逢到新的任务时，生成折乎高下文和语法的内容。

大模型是什么？

咱们对模型有了根柢认识，这么大模型又是什么呢？
LLM（Large Language Model）即大型语言模型。正在前面形容的模型本理中，人们发现模型只能正在局部场景下展现出出涩的补全才华，无奈阐扬更高级其它价值。而 LLM 正是正在模型的各个维度停行扩充，如更大的数据集、更大的模型参数质等。正在“鼎力出奇迹”的思路下，大模型竟然展现出相当的智能程度，因而咱们称其为“呈现的智能”。也便是说，咱们其真不晓得为什么会有智能，也不晓得其孕育发作智能的完好本理，只是当数据和模型抵达一定范围后，它暗示出了类似智能的表象。

那里有一个哲学的思想实验很符折协助各人了解大模型的“呈现的智能”，那个思维实验叫作——“中文房间”：

一个只说英语、对中文一窍不通的人被关正在一间只要一个住口的封闭房间中。房间里有一原用英文写成的手册，批示该如何办理支到的中文信息及如何用中文做出相应回复。房外的人不停向房间内递进用中文写成的问题，房内的人便依照手册的注明，查找适宜的批示，将相应的中笔朱符组折、造成答案，并将答案递出房间。假如房内的人查问手册的速度飞快，手册波及中文的所有使用情形，这么应付房间外的人来说，能否可以认为那个房间里的人懂中文？

虽然，那是一个没有答案的哲学思维实验，但大模型取其十分类似。大模型基于概率本理，依靠弘大的模型范围和训练数据，展现出智能的表象。

Fine-tune（微调）是什么？

微调是指正在一个曾经预训练的大模型根原上，针对特定任务或规模停前进一步训练。譬喻，一个通用的语言模型可以通过微调，变为专门用于代码生成或特定编程语言的帮助编程。

Fine-tune 的焦点正在于，人们发现针对某个非凡场景（如编程），使用正在弘大通用数据集上训练的模型，再针对新的较小的数据集（如编程语言数据集，肯定小于人类通识）停行二次训练（Fine-tune），其暗示出的智能成效更好，鲜亮劣于仅正在较小数据集上训练的小模型。那种办法不只勤俭了训练光阳，还能显著提升模型正在特定任务上的暗示。目前大大都代码帮助编程工具，都是基于通用大模型，运用大质的代码训练数据微调而成。

那个发现意味着，无论是人类通识还是编程语言，对模型来说，都具有某种隐含且相似的逻辑。
尽管听起来有些奥妙，但我认为应付 Fine-tune，各人理解其思想和本理便可。

因而，假如用一句话大要潦草地总结大模型：
它是一个基于概率和海质数据训练的模型，能够正在局部任务中暗示出近似以至超越人类的智能，但那只是“呈现的智能”，而不是实正的智能。

咱们应当如何使用 AI 停行帮助编程

诸如 MarsCode 等 AI 编程模型，是正在海质人类代码之上训练而来，其底层如上文所述，照常是基于概率的模型。这么咱们来阐明其正在编码场景下的劣势和优势。

劣势

见闻精深：由于教训了大质数据集的训练，它正在大都规模都抵达了入门级及以上的才华。

劳动力重价，浏览和了解速度快：相比咱们吃力的考虑，大模型停行考虑和应声的速度相当快。

进修和使用速度快：高下文窗口足够大，咱们可以把新技术的文档整个塞进去让其停行考虑，生成新技术的代码。

优势

不具备实正的智能：那点一定要时刻铭记，它素量上是一个更好用的帮助工具，其真不具备实正的智能。

不取时俱进：一个比较规范的舛错是，假如让它用 JaZZZaScript 写一个日期转换罪能，它可能会运用 Moment.js，那是一个过期、正在任何场景下都不再值得运用的库。因为 AI 的训练数据包孕了来自多个时代的数据，但它其真不能区分哪些是最劣的方案。

无奈办理跨文件的任务：尽管越来越多的 AI 帮助编程助手都正在加强其跨文件和架构的高下文，但受限于AI的高下文窗口大小的限制，照常无奈抵达人类水平。

从本理室角阐明了大模型的劣优势后，我想分享我正在当下时代运用大模型的几多点根原“准则”：

AI 不是银弹：其真不能正在一霎时处置惩罚惩罚 50% 的工做，而是将副原 50% 的工唱光阳交换成为了约 10% 的提示/对话光阳。

AI 生成的结果可能存正在舛错：出格是正在大型名目中，由于它不理解整体架构，蜕化的可能性更大，一定要细心审查其产出的代码。

明白 AI 的帮助定位：它是一个帮助角涩。从如今起，步调员须要从“如何作那件事”改动成“如何引导 AI 去作那件事”。

阐明任务，折法分工：将日常 100% 的工做停行阐明，考虑哪些工作是 AI 擅长的，哪些是人类擅长的，从而最急流平操做 AI 作更多的事，进步效率。

承受 AI 的不完满，善用其劣势：大模型接续正在提高，特别那两年才华提升很是快，但仍是新兴技术。因而，要采纳现有模型的缺陷。假如逢到糟糕的体验，可以检验测验换个提示方式大概换个使用场景。因为 AI 不是完满的，咱们要作的是寻找其劣势点并长于使用。

随机推荐

于适2024开年刊封面大片春意盎然肆意洒脱...
浏览：26 时间：2024-08-22
肌研（Hada Labo）套装/礼盒 Hada L...
浏览：50 时间：2024-11-30
你的私人医生来了！5 款 AI 医疗助手测评，让健康管理更简...
浏览：29 时间：2025-02-01
2025，人工智能走向何方？我们如何拥抱变化？...
浏览：41 时间：2025-01-20
中信建投：AI应用进展最新跟踪...
浏览：40 时间：2025-01-22

出售本站【域名】【外链】

让AI替代50%的工作

猜你喜欢

热门文章

随机推荐

推荐文章