1
00:00:00,080 --> 00:00:02,960
好吧，你相信这是倒数第二天吗？

2
00:00:03,000 --> 00:00:06,440
欢迎来到该计划的倒数第二天。

3
00:00:07,040 --> 00:00:07,800
就是现在了。

4
00:00:07,840 --> 00:00:10,160
我们现在是第八周第四天，今天和明天。

5
00:00:10,200 --> 00:00:10,800
还得走。

6
00:00:10,800 --> 00:00:13,680
今天我们进入一个巨大的人工智能。

7
00:00:13,840 --> 00:00:19,080
我们将了解您如何使用工具来协调代理。

8
00:00:19,080 --> 00:00:24,480
我们将建立一个规划代理，具有您正在构建的代理循环关键专业知识。

9
00:00:24,800 --> 00:00:31,280
对于那些真正学过我的代理课程的人来说，您已经了解了代理人工智能的全部内容。

10
00:00:31,440 --> 00:00:36,960
有时，从首要原则出发，构建代理框架，以这种方式处理它是很有价值的

11
00:00:36,960 --> 00:00:39,600
我们自己，自己编曲。

12
00:00:39,600 --> 00:00:44,720
这确实很有帮助，可以帮助您深入理解代理人工智能的含义。

13
00:00:45,040 --> 00:00:52,560
如您所知，使用现成的框架为您做很多事情是很常见的，

14
00:00:52,600 --> 00:00:55,920
这使得我们可以非常快速地让代理站起来并相互交谈。

15
00:00:55,920 --> 00:00:59,160
但很高兴了解它在幕后的实际工作原理。

16
00:00:59,160 --> 00:01:00,520
这就是我们今天要做的。

17
00:01:00,630 --> 00:01:05,990
现在，在本周初，我定义了基因人工智能，并给了你们一些现代人工智能的定义。

18
00:01:05,990 --> 00:01:13,510
一，最近的一个，就是当你llms配备了工具，调用工具

19
00:01:13,510 --> 00:01:19,030
在循环中实现目标，llms 在循环中调用工具来实现目标。

20
00:01:19,190 --> 00:01:26,430
呃，但是当你拥有一个遵循这些定义的人工智能时，就会有一些特征

21
00:01:26,430 --> 00:01:31,670
您生产的产品、您会注意到的产品以及工程解决方案之间的共同点。

22
00:01:32,030 --> 00:01:33,510
这就是您所要寻找的。

23
00:01:33,670 --> 00:01:39,030
其中之一是，人工智能解决方案通常涉及将更大的问题分解为更小的步骤，

24
00:01:39,030 --> 00:01:42,510
这些较小的步骤是由单独的法学硕士调用来执行的。

25
00:01:42,670 --> 00:01:45,150
这是他们的一个非常普遍的特征。

26
00:01:45,310 --> 00:01:51,190
这也有我之前提到的陷阱，代理陷阱，当人们太快分裂时

27
00:01:51,190 --> 00:01:56,550
将他们的问题分解为步骤，特别是当他们为这些步骤赋予类似人类的责任时

28
00:01:56,550 --> 00:02:01,060
与，与代理人姓名和，他们没有这样做是为了解决问题。

29
00:02:01,060 --> 00:02:02,580
他们这么做了，因为那就是这样。

30
00:02:02,620 --> 00:02:04,660
人类角色会是什么样子。

31
00:02:04,700 --> 00:02:07,580
结果可能是这样。

32
00:02:07,580 --> 00:02:11,020
但我只是建议你从理解问题开始。

33
00:02:11,020 --> 00:02:14,220
您将其分成更小的 LMS 来解决问题。

34
00:02:14,220 --> 00:02:17,740
嗯，不仅仅是因为听起来这会成为一名优秀的经纪人。

35
00:02:18,020 --> 00:02:19,540
好吧，这是一个标志。

36
00:02:19,540 --> 00:02:21,460
当然，另一种方法是使用工具。

37
00:02:21,580 --> 00:02:25,660
呃，工具调用确实是我的出处。

38
00:02:25,660 --> 00:02:31,700
你可以为 LM 配备一个工具来执行一些额外的功能，事实上，

39
00:02:31,700 --> 00:02:35,620
该工具可能做的就是调用另一个 LM。

40
00:02:35,740 --> 00:02:37,340
这就是您拥有 LMS 的方式。

41
00:02:37,380 --> 00:02:42,980
控制工作流程并调用其他 LMS 和结构化输出是另一个功能。

42
00:02:42,980 --> 00:02:46,380
您可能认为工具和结构化输出听起来非常不同。

43
00:02:46,420 --> 00:02:52,620
LM 配备的工具可以采取行动，结构化输出限制了它所产生的输出

44
00:02:52,620 --> 00:02:53,180
跟上。

45
00:02:53,420 --> 00:02:55,180
事实上，它们的关系非常密切。

46
00:02:55,380 --> 00:03:00,890
呃，对于大多数提供商来说，结构化输出实际上是通过工具实现的。

47
00:03:00,890 --> 00:03:03,850
它是生成结构化输出的工具调用。

48
00:03:03,850 --> 00:03:05,050
这很有趣。

49
00:03:05,450 --> 00:03:11,330
另一种思考方式是，作为调用工具的替代方案，您可以生成

50
00:03:11,330 --> 00:03:12,450
结构化输出。

51
00:03:12,450 --> 00:03:16,330
在该结构化输出中描述您接下来想要发生的事情。

52
00:03:16,530 --> 00:03:21,690
所以事实上，尽管工具和结构化输出听起来像是非常不同的东西，但它们是

53
00:03:21,690 --> 00:03:25,210
非常密切相关，并且它们几乎是类似的概念。

54
00:03:25,330 --> 00:03:30,730
嗯，但它们都是代理人工智能解决方案的标志。

55
00:03:30,730 --> 00:03:38,770
然后是代理环境，它是一种围绕代理的构造，允许

56
00:03:38,770 --> 00:03:43,610
他们以某种方式相互沟通、传递信息或拥有共同信息

57
00:03:43,610 --> 00:03:44,010
他们。

58
00:03:44,130 --> 00:03:46,330
这是代理解决方案的标志。

59
00:03:46,410 --> 00:03:52,050
这很常见，呃，这是我们将自己创造的东西。

60
00:03:52,050 --> 00:03:57,050
但是，如果您使用代理框架，当然，它会附带这种结构

61
00:03:57,610 --> 00:04:00,120
然后是规划代理。

62
00:04:00,280 --> 00:04:06,360
通常，这是另一个 LM 调用，能够决定何时发生什么。

63
00:04:06,680 --> 00:04:10,120
在简单的代理解决方案中，这可以只是一个工作流程。

64
00:04:10,120 --> 00:04:17,160
它可能只是 Python 代码来协调在更高级的代理解决方案中发生的情况

65
00:04:17,160 --> 00:04:22,320
就像我们要做的那样，它可以是具有工具的 LM 调用，而这些工具

66
00:04:22,320 --> 00:04:24,320
允许它呼叫其他代理。

67
00:04:24,320 --> 00:04:27,440
或者它可能是生成结构化输出的 LM 调用。

68
00:04:27,440 --> 00:04:31,720
结构化输出描述了当其中任何一个起作用时会发生什么。

69
00:04:32,600 --> 00:04:36,160
最后，这可能是其中最粘稠的一个。

70
00:04:36,200 --> 00:04:38,720
定义最不明确的一个。

71
00:04:38,920 --> 00:04:46,120
这是一种自治的想法吗？感觉这个解决方案不仅仅是一个聊天的解决方案

72
00:04:46,120 --> 00:04:48,960
对于用户来说，它不仅仅是一个AI助手。

73
00:04:48,960 --> 00:04:53,880
这是一种超越此之外的某种持久性的东西，这种结构只是与一个人聊天

74
00:04:53,880 --> 00:04:54,320
用户。

75
00:04:54,480 --> 00:05:01,070
呃，呃，是的，它有某种超越单一交互的记忆，给你一种感觉

76
00:05:01,110 --> 00:05:03,910
你有一个真正的人工智能，呃，平台。

77
00:05:03,910 --> 00:05:09,550
它似乎会持续存在，你可以想象我们将要建造的东西将能够

78
00:05:09,590 --> 00:05:15,590
每隔一段时间，只要有需要，就以一种能够让

79
00:05:15,590 --> 00:05:17,510
那种自主感和记忆力。

80
00:05:17,510 --> 00:05:24,350
它能够在后台执行任务，然后主动执行

81
00:05:24,350 --> 00:05:26,430
请联系我们并提供答案。

82
00:05:26,430 --> 00:05:30,750
这类事情就像一个标志，而且可能是其中定义最不明确的。

83
00:05:30,750 --> 00:05:33,630
所以这让你了解什么是能动性。

84
00:05:33,630 --> 00:05:39,390
当然，我们将在 Agentic 平台中勾选所有这些框，呃，呃，并且，

85
00:05:39,430 --> 00:05:44,190
但您通常会看到，如果平台勾选了其中任何一个，则它们被描述为代理

86
00:05:44,190 --> 00:05:44,910
盒子。

87
00:05:44,910 --> 00:05:48,070
这个术语是一个非常、呃、广泛的术语，可以适用。

88
00:05:48,070 --> 00:05:52,590
这是一个涵盖性术语，可以适用于任何此类解决方案，但可以肯定的是，您会发现

89
00:05:52,590 --> 00:05:57,790
更倾向于的人有更严格的定义，并且会说只有在存在的情况下它才是代理的

90
00:05:57,990 --> 00:06:01,620
显然，这是一个可以永远持续下去的代理循环。

91
00:06:01,620 --> 00:06:04,620
这更像是一种克劳德代码的体验。

92
00:06:04,940 --> 00:06:07,340
我们正在构建的东西也非常接近这个目标。

93
00:06:07,580 --> 00:06:07,980
好的。

94
00:06:07,980 --> 00:06:10,820
并提醒您，我们正在构建的东西是什么？

95
00:06:10,980 --> 00:06:16,300
好吧，你会记得，我们昨天构建了一个扫描代理，它能够识别有希望的

96
00:06:16,300 --> 00:06:17,020
交易。

97
00:06:17,020 --> 00:06:23,380
当然，我们的扫描仪代理使用结构化输出来转换，呃，抓取的非结构化数据

98
00:06:23,380 --> 00:06:28,820
从互联网和 RSS 提要到的东西是一个迂腐的对象，里面充满了

99
00:06:28,820 --> 00:06:30,300
交易信息和价格。

100
00:06:30,740 --> 00:06:36,660
有一个集成代理仅根据某物的描述来估计其真实价值。

101
00:06:36,660 --> 00:06:37,140
确实如此。

102
00:06:37,180 --> 00:06:43,060
它会进行预处理，以更适合模型的格式重写它。

103
00:06:43,180 --> 00:06:46,060
然后，当然，它会调用许多其他模型。

104
00:06:46,060 --> 00:06:50,820
我们有一个消息代理，可以使用克劳德十四行诗编写炒作消息。

105
00:06:50,820 --> 00:06:53,580
然后我们将使用 Pushover 发送推送通知。

106
00:06:53,860 --> 00:06:57,900
当然，在该乐团特工的背后，我们还有专业特工。

107
00:06:57,900 --> 00:06:58,900
那它跑到哪里去了？

108
00:06:58,970 --> 00:06:59,610
它正在继续运行。

109
00:07:00,770 --> 00:07:05,890
我们有一个正在使用 Rag 处理器的前沿代理。

110
00:07:05,930 --> 00:07:10,210
它对我们要定价的东西的文本进行编码。

111
00:07:10,370 --> 00:07:12,650
它会查找色度中的类似产品。

112
00:07:12,650 --> 00:07:16,530
然后它会使用所有这些信息调用 GPT 5 1。

113
00:07:16,530 --> 00:07:18,010
它确实做得很好。

114
00:07:18,290 --> 00:07:22,930
然后我们有一个神经网络代理，它使用深度神经网络来估计价格

115
00:07:22,930 --> 00:07:23,690
第六周。

116
00:07:24,250 --> 00:07:28,330
今天，我们将构建协调这些活动的规划代理。

117
00:07:28,370 --> 00:07:32,890
它会做到这一点，因为我们将给它三个工具，一个允许它调用的工具

118
00:07:32,890 --> 00:07:37,490
这三个步骤中的每一个，就其而言，都有三个向右的特工。

119
00:07:37,530 --> 00:07:38,290
它们只是工具。

120
00:07:38,290 --> 00:07:39,930
它不知道这是一个LLM。

121
00:07:39,970 --> 00:07:42,610
它只是将其视为可以调用的三个不同工具。

122
00:07:42,650 --> 00:07:44,730
很像我们在第二周构建的工具。

123
00:07:45,010 --> 00:07:48,770
明天我们将完成代理框架和 UI。

124
00:07:49,130 --> 00:07:52,090
这将会是，呃，将会非常棒。

125
00:07:52,090 --> 00:07:54,770
这将是史诗般的结局。

126
00:07:55,170 --> 00:07:57,330
呃，但现在让我们转到光标。

127
00:07:57,370 --> 00:07:59,610
让我们自己打造一个策划代理。