1
00:00:00,160 --> 00:00:05,440
好吧，我答应给你一个结局，而你将会得到一个结局。

2
00:00:05,480 --> 00:00:06,800
欢迎来到第八周。

3
00:00:06,840 --> 00:00:08,520
欢迎来到上周。

4
00:00:08,560 --> 00:00:11,240
这将是真正风雨交加的一周。

5
00:00:11,560 --> 00:00:12,720
让我们开始吧。

6
00:00:12,760 --> 00:00:19,920
所以你已经知道你可以生成代码，你可以生成文本，你可以使用前沿闭源

7
00:00:19,960 --> 00:00:24,360
付费模型和开源模型通过骆驼通过拥抱的脸。

8
00:00:24,680 --> 00:00:31,320
您可以使用工具、构建助手、使用带 lang 链和不带 lang 链的 rag 并对其进行评估。

9
00:00:31,360 --> 00:00:36,680
您可以遵循五步策略来解决问题，包括整理数据、制定基线

10
00:00:36,680 --> 00:00:38,200
模型，微调前沿模型。

11
00:00:38,200 --> 00:00:45,440
现在，您可以自信地执行从预训练的模型开始微调您自己的模型的过程

12
00:00:45,440 --> 00:00:51,360
模型，将其转变为只要有足够的数据和良好的任务，你就可以超越

13
00:00:51,360 --> 00:00:52,240
边境。

14
00:00:52,920 --> 00:00:54,440
上周真是一周啊。

15
00:00:54,600 --> 00:00:56,600
这次一切都齐了。

16
00:00:56,600 --> 00:01:00,690
本周我们将修改我们一路上所做的所有不同的点滴，

17
00:01:00,690 --> 00:01:04,890
并将其整合到一起，将代理融入其中。

18
00:01:05,250 --> 00:01:06,050
当然是代理商。

19
00:01:06,090 --> 00:01:07,090
超级刺激。

20
00:01:07,130 --> 00:01:08,570
我们将引进代理人。

21
00:01:08,570 --> 00:01:14,650
我们还将再次引入，呃，抹布，以一种希望能带来惊喜的方式重复抹布

22
00:01:14,650 --> 00:01:14,890
你。

23
00:01:15,290 --> 00:01:23,130
今天我们将首先在名为 models.com 的无服务器人工智能平台中部署法学硕士，该平台

24
00:01:23,130 --> 00:01:24,210
实在是太棒了。

25
00:01:24,370 --> 00:01:28,570
因此，我们将做一些对产品生产表示认可的事情。

26
00:01:28,610 --> 00:01:33,210
我们将采用经过微调的 LM，通过 models.com 将其部署在云上，然后我们将

27
00:01:33,250 --> 00:01:34,810
将其转变为代理。

28
00:01:34,850 --> 00:01:39,970
所有这些都将在今天发生，但我们只看一次图表。

29
00:01:40,210 --> 00:01:42,650
呃，你从那里开始一直在那里。

30
00:01:42,650 --> 00:01:43,810
一直到左边。

31
00:01:43,810 --> 00:01:48,770
似乎很久以前我们就完成了聊天完成 API 的基础工作。

32
00:01:48,810 --> 00:01:51,210
我们研究了不同的前沿 API。

33
00:01:51,410 --> 00:01:55,090
我们第一次做了一些 UI 和多模态。

34
00:01:55,410 --> 00:01:58,090
然后在第三周，我们开始拥抱脸部。

35
00:01:58,090 --> 00:02:02,020
我们使用了管道，然后使用了模型转换器库。

36
00:02:02,020 --> 00:02:06,140
然后在第四周，我们为手头的任务选择了合适的 LM。

37
00:02:06,140 --> 00:02:11,540
我们构建了一些东西，使代码从 Python 移植到 C++ 的速度大大加快。

38
00:02:11,860 --> 00:02:14,380
第五周，我们深入研究 Rag。

39
00:02:14,380 --> 00:02:18,460
我们建立了一个问答系统，我们用长链做到了，没有长链。

40
00:02:18,460 --> 00:02:24,580
然后在第六周，我们策划了一个数据集，令人失望地微调了前沿，结束了这一周

41
00:02:24,620 --> 00:02:26,060
模型没有取得太多成功。

42
00:02:26,060 --> 00:02:29,340
但我们在第七周弥补了这一点，正如我所承诺的那样。

43
00:02:29,380 --> 00:02:32,940
我们对开源模型进行了微调，它的性能超越了前沿。

44
00:02:33,220 --> 00:02:40,060
现在，在第八周，一个温柔的家伙，拉格的回归，以及许多其他的点点滴滴即将到来

45
00:02:40,060 --> 00:02:46,340
在一起，以便到本周末你就能说，好吧，我做到了。

46
00:02:46,460 --> 00:02:52,340
我是一名 LM 工程师，为了提醒您顶点项目，但为了给您提供更多信息，它更多

47
00:02:52,340 --> 00:02:54,500
现在，顶点项目开始热闹起来。

48
00:02:54,580 --> 00:03:00,940
因此，我们将构建一个自主的 A 遗传框架，该框架采用我们构建的模型

49
00:03:00,940 --> 00:03:02,420
将其变成产品。

50
00:03:02,660 --> 00:03:07,340
这个想法是让人感到真正的能动性，我稍后将对此进行定义。

51
00:03:07,340 --> 00:03:14,780
但理想情况下，你想要的东西感觉就像它有一种超越上下文的存在

52
00:03:14,820 --> 00:03:16,380
与用户的聊天。

53
00:03:16,380 --> 00:03:19,220
所以我们希望有一个正在运行的系统。

54
00:03:19,380 --> 00:03:25,380
它将通过订阅 RSS 源来监视在线发布的交易。

55
00:03:25,500 --> 00:03:29,020
当它发现已发布的交易时，它将检查这些交易。

56
00:03:29,020 --> 00:03:34,540
它会挑选那些感觉多汁的东西，并估算它的实际价格

57
00:03:34,540 --> 00:03:35,100
成本。

58
00:03:35,260 --> 00:03:36,700
谁知道它将如何做到这一点。

59
00:03:37,260 --> 00:03:41,500
然后一旦它看到了，它就会说，好吧，所以这里有很多在线的东西。

60
00:03:41,500 --> 00:03:43,740
以下是它们的特价价格。

61
00:03:43,740 --> 00:03:48,620
根据我的所有智慧，我认为它们实际上值多少钱。

62
00:03:48,660 --> 00:03:52,780
现在我已经确定哪一项是最引人注目的交易。

63
00:03:53,060 --> 00:03:55,740
这样它就能感受到真正的自主和自由。

64
00:03:55,780 --> 00:04:02,070
然后它会向您的手机、我的手机和您的手机发送有关交易的推送通知

65
00:04:02,070 --> 00:04:06,710
这样我们就可以得到这笔交易，也许可以给自己买一台新电视或其他什么东西。

66
00:04:06,910 --> 00:04:11,590
因此，我们将有七个不同的代理人在这方面进行合作。

67
00:04:11,590 --> 00:04:17,710
他们将做各种各样的事情，确定交易，定价，而我们将

68
00:04:17,710 --> 00:04:24,950
当然，正如您所想的，我们的模型可以超越前沿来估算价格。

69
00:04:24,950 --> 00:04:26,390
但我们还将做更多的事情。

70
00:04:26,430 --> 00:04:29,390
我们还将构建第二个模型来估计价格。

71
00:04:29,390 --> 00:04:33,550
它将使用 Rag，以便我们将所有内容整合在一起。

72
00:04:33,550 --> 00:04:34,950
这就是顶点项目。

73
00:04:34,950 --> 00:04:35,630
结论。

74
00:04:35,630 --> 00:04:37,310
那就是价格合适。

75
00:04:37,310 --> 00:04:42,950
我们将在本周末之前启动并运行并为您提供优惠。

76
00:04:42,990 --> 00:04:47,070
因此，为了给您提供游戏顺序，我为您准备了什么，我应该警告您

77
00:04:47,070 --> 00:04:48,990
这周会过得很快。

78
00:04:49,030 --> 00:04:51,430
在这一点上，你的专业人士，你知道，这些东西。

79
00:04:51,430 --> 00:04:52,030
你已经得到了这个。

80
00:04:52,070 --> 00:04:53,150
我们可以快点走。

81
00:04:53,350 --> 00:04:59,520
当然，在第六周，也就是两周前，我们整理了数据，评估了我们的模型，并尝试了

82
00:04:59,520 --> 00:05:00,440
前沿模型。

83
00:05:00,440 --> 00:05:03,640
上周我们微调了我们的开源模型。

84
00:05:03,640 --> 00:05:05,960
那么本周我为您准备了什么？

85
00:05:06,000 --> 00:05:08,000
这是未来五天的情况。

86
00:05:08,360 --> 00:05:14,600
今天的第一天，我们将采用我们的法学硕士，我们的微调模型并将其部署在互联网上

87
00:05:14,600 --> 00:05:21,200
使用无服务器人工智能平台 Modalerts.com，这是生产模型的好方法。

88
00:05:21,200 --> 00:05:22,880
这是我在日常工作中使用的。

89
00:05:22,920 --> 00:05:27,840
它非常受欢迎，其原因我们明天会讨论。

90
00:05:27,880 --> 00:05:33,840
然后我们将制作一个替代 Pricer，它将使用带有 Rag 的前沿模型。

91
00:05:34,040 --> 00:05:35,640
那将会非常有趣。

92
00:05:35,920 --> 00:05:42,200
第三天，我们将构建一个扫描仪代理，它能够订阅 RSS 提要、解析

93
00:05:42,200 --> 00:05:48,160
他们并找到好的交易，以及能够向我们的手机发送推送通知的消息代理。

94
00:05:48,360 --> 00:05:51,840
然后第四天，这是热量升高的时候。

95
00:05:51,840 --> 00:05:58,010
我们将建立我们的自主规划代理来协调代理之间的活动，

96
00:05:58,010 --> 00:05:59,490
决定何时做什么。

97
00:05:59,530 --> 00:06:03,250
然后我们将在第五天以压轴戏来结束它。

98
00:06:03,650 --> 00:06:05,130
这就是我为你准备的。

99
00:06:05,170 --> 00:06:10,210
好的，我想再次提醒您，您可以遵循三种不同的方式

100
00:06:10,210 --> 00:06:10,570
这。

101
00:06:10,690 --> 00:06:14,130
仅仅凭直觉来了解正在发生的事情绝对没问题。

102
00:06:14,170 --> 00:06:18,690
您不必运行代码，特别是如果过去几周对您来说还很陌生的话

103
00:06:18,690 --> 00:06:21,130
感觉这已经变得超级先进了。

104
00:06:21,290 --> 00:06:22,330
一切都很好。

105
00:06:22,330 --> 00:06:25,330
只需对正在发生的事情有直觉，了解概念。

106
00:06:25,610 --> 00:06:28,490
然而，如果你想继续，那就太好了。

107
00:06:28,490 --> 00:06:32,370
您应该能够坚持使用简单的数据集，以便事情进展得更快。

108
00:06:32,410 --> 00:06:36,690
有几个地方你可以走捷径，特别是当出现问题时。

109
00:06:36,730 --> 00:06:39,450
如果有什么事情发生了，你可以绕过很多事情。

110
00:06:39,450 --> 00:06:41,970
我会尽力，当我们到达那里时，我会尽力指出这一点。

111
00:06:41,970 --> 00:06:46,050
您也可以深入研究并找出如何绕过它的不同部分。

112
00:06:46,050 --> 00:06:48,170
这周尤其容易。

113
00:06:48,170 --> 00:06:53,730
然后第三个选择是你可以卷起袖子深入研究，使用完整的数据集，进行调整，

114
00:06:53,850 --> 00:06:57,450
做出一些改变，让我们在前进的过程中变得更好。

115
00:06:57,490 --> 00:07:01,370
这是为那些真正想了解细节的人准备的。

116
00:07:01,370 --> 00:07:04,890
本周将有很多机会。

117
00:07:04,890 --> 00:07:08,290
当然，本周我们将推出基因人工智能。

118
00:07:08,490 --> 00:07:11,530
如你所知，我有一门关于基因人工智能的完整课程。

119
00:07:11,530 --> 00:07:15,210
因此，我们不会详细讨论代理的细节。

120
00:07:15,210 --> 00:07:21,450
但我认为我应该首先定义代理是什么，以便您了解一些背景信息。

121
00:07:21,490 --> 00:07:24,690
当然，代理有很多不同的定义。

122
00:07:24,690 --> 00:07:29,930
事实上，有一些模因是关于基因人工智能如何可以成为你想要的任何东西。

123
00:07:30,170 --> 00:07:33,210
一般来说，人们会思考这样的事情，不是吗？

124
00:07:33,250 --> 00:07:34,650
它有自主权吗？

125
00:07:34,690 --> 00:07:35,810
有代理权吗？

126
00:07:35,810 --> 00:07:41,330
它是一个超越个人用户聊天的平台吗？

127
00:07:41,370 --> 00:07:45,130
任何类似的事情都会给你一种印象，那就是你正在与基因人工智能一起工作。

128
00:07:45,370 --> 00:07:50,770
但有一些定义已经被广泛流传，我想我只列出其中的一些

129
00:07:50,770 --> 00:07:53,100
现在你就有了这样的背景。

130
00:07:53,140 --> 00:07:57,860
第一个定义是我不知道 Sam Altman 是否直接使用过这些词，但是

131
00:07:57,860 --> 00:07:59,580
他说了这样的话。

132
00:07:59,740 --> 00:08:06,900
呃，所以这有点像 OpenAI 的一个可以理解的定义，即代理是

133
00:08:07,060 --> 00:08:11,340
人工智能系统可以以独立的方式为您工作。

134
00:08:11,340 --> 00:08:16,940
所以这是它的一个稍微拟人化的版本，相当于人类工人。

135
00:08:17,060 --> 00:08:22,300
这意味着它是一个你可以考虑的人工智能系统，就像你可以委托给它一样

136
00:08:22,500 --> 00:08:28,300
你可以想象，像OpenAI，以前叫operator，现在叫GPT agent。

137
00:08:28,340 --> 00:08:34,060
这个，这个想法，你可以吃点东西并对它说，嘿，帮我预订餐厅

138
00:08:34,060 --> 00:08:38,580
下周四，我所在地区的中餐就可以买到了。

139
00:08:38,580 --> 00:08:43,860
然后它会去进行研究并找到某个地方并可能在 OpenTable 上查看

140
00:08:43,860 --> 00:08:45,300
为您预订以及其余的一切。

141
00:08:45,300 --> 00:08:48,340
你会感觉到有什么东西正在运行。

142
00:08:48,540 --> 00:08:52,630
这是第一个被反复提及的代理定义。

143
00:08:52,630 --> 00:08:59,870
然后在 2025 年初左右，出现了一种新兴观点，即定义代理的正确方法

144
00:08:59,870 --> 00:09:07,230
这是一个人工智能系统，LM 控制工作流程，LM 控制工作流程。

145
00:09:07,230 --> 00:09:08,790
这就是由此产生的东西。

146
00:09:08,790 --> 00:09:10,270
我在《拥抱的脸》里看到过。

147
00:09:10,270 --> 00:09:15,510
Anthropic 在他们的开创性博客文章“构建有效代理”中也遵循了这些思路。

148
00:09:15,630 --> 00:09:21,150
呃，所以想法就在这里，你有某种没有固定执行顺序的系统

149
00:09:21,150 --> 00:09:21,430
事物。

150
00:09:21,430 --> 00:09:28,030
你不会先做 A，然后做 B，然后做 C，而是先提示 LM，然后说，嘿，你可以

151
00:09:28,030 --> 00:09:31,710
要做 A、B 或 C，并且您需要实现该目标。

152
00:09:31,710 --> 00:09:34,030
现在决定你想什么时候做什么。

153
00:09:34,070 --> 00:09:35,230
它会生成代币。

154
00:09:35,230 --> 00:09:40,910
在这些标记中，它描述了您是否执行 A、B 或 C，并且您编写了然后执行操作的代码

155
00:09:40,910 --> 00:09:43,470
LM 预测的结果。

156
00:09:43,750 --> 00:09:48,910
因此，您可以将其视为LM 具有某种自主权的系统。

157
00:09:48,950 --> 00:09:54,270
它可以通过代理来选择以什么顺序执行哪些步骤。

158
00:09:54,270 --> 00:09:59,830
这实际上是用来与所谓的代理工作流程形成对比的，至少在 Anthropic 中是这样的

159
00:09:59,830 --> 00:10:06,310
定义中，存在多个 LM 调用，例如 A、B、C，但它只是精心安排的

160
00:10:06,310 --> 00:10:07,550
与Python代码。

161
00:10:07,550 --> 00:10:12,350
只需执行 A，然后执行 B，然后执行 C，而不是通过 LM 调用。

162
00:10:12,350 --> 00:10:19,470
这就是真正的代理人工智能和具有多个代理的工作流程之间的区别。

163
00:10:19,470 --> 00:10:20,430
LM 打电话来。

164
00:10:20,670 --> 00:10:26,750
然后是第三个定义，这是人们真正意义上的新出现的定义

165
00:10:26,750 --> 00:10:34,590
落后的是，代理系统是一个有一个代理，一个运行的LM

166
00:10:34,590 --> 00:10:38,230
循环中的工具以实现目标。

167
00:10:38,510 --> 00:10:44,310
所以你有一个 LM 或者多个 LM，并且有某种目标，并且它配备了

168
00:10:44,310 --> 00:10:47,670
使用一套工具，我们在第二周所做的事情。

169
00:10:47,950 --> 00:10:50,720
它是为了实现该目标。

170
00:10:50,720 --> 00:10:51,920
它可以调用一个工具。

171
00:10:51,920 --> 00:10:57,120
然后，如果它尚未实现该目标，您的 Python 代码会在循环中再次调用它。

172
00:10:57,120 --> 00:10:59,760
而且它不断地被一次又一次地调用。

173
00:11:00,040 --> 00:11:05,560
你真正感受到这种体验的地方是使用我演示的代码之类的东西

174
00:11:05,560 --> 00:11:06,720
就回到最开始的地方。

175
00:11:06,720 --> 00:11:12,640
你确实可以看到它有一个待办事项列表，它正在循环并且正在执行活动。

176
00:11:12,800 --> 00:11:18,160
但在很大程度上，我们使用配有工具的 LMS 做的许多不同的事情

177
00:11:18,160 --> 00:11:19,720
涉及使用循环。

178
00:11:19,720 --> 00:11:22,400
这适用于大多数此类系统。

179
00:11:22,680 --> 00:11:27,000
因此，我们本周要构建的内容几乎勾选了所有这三个定义。

180
00:11:27,000 --> 00:11:29,080
大部分都是黄色的。

181
00:11:29,120 --> 00:11:33,960
将有一个代理来控制涉及调用其他学习管理系统的工作流程。

182
00:11:34,440 --> 00:11:36,240
但到了一定程度就会出现循环。

183
00:11:36,240 --> 00:11:41,920
所以有这样的想法，那就是有一些东西会循环直到它准备好。

184
00:11:42,080 --> 00:11:45,440
呃，所以我们本周确实勾选了所有三个框。

185
00:11:45,440 --> 00:11:49,280
希望这能为您提供一些有用的背景信息，并为未来奠定基础。