1
00:00:00,080 --> 00:00:04,800
现在是第四周第三天，这一天我们终于要回到实验室了。

2
00:00:04,800 --> 00:00:08,080
现在已经是一个可以使用前沿模型进行编码的时代了。

3
00:00:08,080 --> 00:00:14,560
您可以使用开源 LLMS 构建解决方案，现在您可以在以下位置为该任务选择正确的 LLM：

4
00:00:14,640 --> 00:00:16,560
基于指标和排行榜的手牌。

5
00:00:16,840 --> 00:00:21,400
今天，我们将评估模型的编码能力，并且我们将使用前沿

6
00:00:21,400 --> 00:00:25,400
生成代码的模型将被构建、构建、构建和光标。

7
00:00:25,720 --> 00:00:30,080
但在我们开始之前，我还有几件事要宣布。

8
00:00:30,240 --> 00:00:32,440
呃，但请听我说完。

9
00:00:32,440 --> 00:00:37,440
每个人工智能工程师都需要了解一些非常重要的事情。

10
00:00:37,440 --> 00:00:45,200
作为一名人工智能工程师、一名法学硕士工程师，你的宣誓职责是：

11
00:00:45,200 --> 00:00:46,840
你坚持自己。

12
00:00:47,240 --> 00:00:53,280
这是关于推动你的业务，并且是关于发现业务问题。

13
00:00:53,720 --> 00:00:56,360
我发现自己经常遇到这种情况。

14
00:00:56,480 --> 00:01:03,120
我发现人们来找我，他们会说，我想要为我的组织配备一个人工智能代理之类的话

15
00:01:03,120 --> 00:01:03,720
像那样。

16
00:01:03,760 --> 00:01:09,530
对我来说，人们经常向我提出这样的问题，包括资深人士，

17
00:01:09,530 --> 00:01:14,010
包括高级管理人员，包括来自各种不同背景的人。

18
00:01:14,210 --> 00:01:18,570
我对他们说的问题，就是你们都需要对那些说的人说的话

19
00:01:18,570 --> 00:01:25,250
这对您来说是肯定的，但是您要解决什么业务问题呢？

20
00:01:25,850 --> 00:01:28,050
让人们回到业务问题上来。

21
00:01:28,050 --> 00:01:31,090
不要让商人谈论解决方案。

22
00:01:31,330 --> 00:01:35,650
有时我发现我对某人这么说，而我得到的问题有点令人困惑

23
00:01:35,650 --> 00:01:35,890
脸。

24
00:01:35,890 --> 00:01:36,810
他们真的不明白。

25
00:01:36,810 --> 00:01:41,970
他们会说，我希望能够对着我的手机说，我的销售数字是多少

26
00:01:41,970 --> 00:01:42,610
今天？

27
00:01:42,610 --> 00:01:44,010
那给我一个代理吧

28
00:01:45,530 --> 00:01:49,810
当然，请您对此的回答应该是肯定的。

29
00:01:49,810 --> 00:01:50,290
伟大的。

30
00:01:50,370 --> 00:01:53,770
嗯，那么这解决了什么业务问题呢？

31
00:01:54,250 --> 00:02:02,490
关键是我们所处的世界对 gen AI 和 Agentic AI 的炒作是如此巨大

32
00:02:02,530 --> 00:02:07,810
每个人都想要一点，这很好，也很令人兴奋，但我们需要始终脚踏实地

33
00:02:07,810 --> 00:02:11,170
人们回到正在解决的实际问题中。

34
00:02:11,170 --> 00:02:16,570
您首先需要了解问题，如何衡量成功和使用

35
00:02:16,570 --> 00:02:21,090
这是您确定当前业务问题的正确解决方案的方法。

36
00:02:21,090 --> 00:02:24,250
它必须从问题开始，您将在家伙文件夹中看到。

37
00:02:24,250 --> 00:02:29,770
指南 12 我相信它为您接下来要做的事情提供了一套很好的建议。

38
00:02:29,810 --> 00:02:36,730
一旦你有了明确的业务目标，有时还有代理人工智能或基因

39
00:02:36,730 --> 00:02:38,970
人工智能可能不是正确的解决方案。

40
00:02:38,970 --> 00:02:44,050
如果有人想在手机上查看今天的销售数据，可能会打开一个 Google 文档

41
00:02:44,050 --> 00:02:48,650
向您显示您的销售数据可能比与您交谈或其他什么东西更容易。

42
00:02:48,650 --> 00:02:50,810
所以总是回到这一点。

43
00:02:50,810 --> 00:02:52,450
我还有另一个烦恼。

44
00:02:52,450 --> 00:02:54,250
指南 12 中也对此进行了介绍。

45
00:02:54,250 --> 00:02:56,650
这与选择合适的明矾有关。

46
00:02:56,650 --> 00:02:58,210
我不是，我不会离题。

47
00:02:58,770 --> 00:03:00,250
作为一名人工智能工程师。

48
00:03:00,530 --> 00:03:02,490
你戴着两顶不同的帽子。

49
00:03:02,490 --> 00:03:07,410
你身兼两职，你是一名数据科学家，你也是一名软件工程师。

50
00:03:07,450 --> 00:03:14,540
你正处于那个十字路口，我倾向于发现我收到的有关项目的问题中有 80%

51
00:03:14,540 --> 00:03:19,540
通过 Udemy 或在与工程问题相关的行业中。

52
00:03:19,540 --> 00:03:22,260
人们问我，我应该使用什么架构？

53
00:03:22,460 --> 00:03:23,980
我将如何进行集成？

54
00:03:23,980 --> 00:03:26,540
我的数据管道是什么？

55
00:03:26,580 --> 00:03:28,260
我应该使用哪些框架？

56
00:03:28,300 --> 00:03:29,300
我应该使用郎链吗？

57
00:03:29,340 --> 00:03:30,500
我应该使用灯光灯吗？

58
00:03:30,780 --> 00:03:35,980
我应该使用像 Croma 这样的开源矢量数据库，还是应该使用 pinecone

59
00:03:35,980 --> 00:03:36,780
还是V8？

60
00:03:36,900 --> 00:03:42,020
这些都是人们问的问题，我觉得人们问这些问题很多，因为

61
00:03:42,020 --> 00:03:43,060
在他们的舒适区。

62
00:03:43,060 --> 00:03:47,460
这些都是工程问题，很多人来自人工智能，来自软件工程

63
00:03:47,460 --> 00:03:48,100
背景。

64
00:03:48,100 --> 00:03:50,700
这是他们习惯问的问题。

65
00:03:50,700 --> 00:03:56,780
但在我看来，这不是最重要的问题，也不是导致问题的关键。

66
00:03:56,820 --> 00:03:58,420
或破坏你的项目。

67
00:03:58,420 --> 00:04:00,140
那么是什么让您的解决方案与众不同呢？

68
00:04:00,180 --> 00:04:01,220
真正重要的是什么？

69
00:04:01,220 --> 00:04:08,580
在我看来，我提出的问题 80% 都与故事的科学部分有关。

70
00:04:08,940 --> 00:04:11,820
正如我们刚刚介绍的那样，您要解决什么业务问题？

71
00:04:12,100 --> 00:04:13,580
您将如何衡量这一点？

72
00:04:13,580 --> 00:04:15,260
您已经解决了该业务问题。

73
00:04:15,260 --> 00:04:19,980
您将如何衡量成功以及您拥有哪些数据以及差距是什么？

74
00:04:19,980 --> 00:04:21,140
您需要什么数据？

75
00:04:21,180 --> 00:04:25,140
因为记住数据将帮助您脱颖而出。

76
00:04:25,140 --> 00:04:28,940
这就是你的 LM 能够超越其他人的原因。

77
00:04:29,220 --> 00:04:31,300
所以这些都是难题。

78
00:04:31,300 --> 00:04:36,340
这些是您应该首先询问并花费最多时间的问题，因为

79
00:04:36,340 --> 00:04:40,140
不同的架构，不同的框架，你选择哪个向量数据库。

80
00:04:40,180 --> 00:04:40,900
这很重要。

81
00:04:40,900 --> 00:04:43,900
这是你必须做出的决定，但这不是最重要的。

82
00:04:43,900 --> 00:04:46,300
这对科学来说是次要的。

83
00:04:46,460 --> 00:04:54,380
这导致您应该采取五个步骤来选择、训练 LM 并将其应用到

84
00:04:54,380 --> 00:04:55,380
商业问题。

85
00:04:55,380 --> 00:04:58,460
我们将在第六周详细介绍这五个步骤。

86
00:04:58,500 --> 00:05:04,380
当我们经历一个真正的顶点项目时，一个应用 LM 解决困难业务的真实案例

87
00:05:04,380 --> 00:05:04,860
问题。

88
00:05:04,860 --> 00:05:09,500
但只是告诉你，现在的五个步骤，这样我就为以后播下了种子，你首先

89
00:05:09,500 --> 00:05:13,300
所有人都需要了解您的业务需求、您正在解决的业务问题以及您如何

90
00:05:13,300 --> 00:05:15,460
将详细衡量成功。

91
00:05:15,620 --> 00:05:22,750
然后，您需要通过使用排行榜选择候选模型来做好准备，也许可以查看

92
00:05:22,750 --> 00:05:27,750
有关模型的基本事实，以了解哪个模型最适合当前的任务。

93
00:05:28,230 --> 00:05:33,550
然后，您可以通过构建原型、测试业务指标来选择要选择的模型

94
00:05:33,590 --> 00:05:39,750
根据你定制的原型，通过构建我们下周做的 Rag 之类的东西，很好

95
00:05:39,750 --> 00:05:43,910
我们将在接下来的两周内进行调整，并可能在上周进行基因人工智能。

96
00:05:44,270 --> 00:05:47,830
然后进行生产化，推出并部署到生产环境。

97
00:05:47,830 --> 00:05:51,150
这就是您要经历的五个步骤。

98
00:05:51,150 --> 00:05:56,590
当然，我们本周重点关注的是准备，即查看排行榜，

99
00:05:56,590 --> 00:06:00,030
确定正确的选择，候选模型。

100
00:06:00,030 --> 00:06:05,270
在了解您的业务需求之后和之前，您现在可以满怀希望地看到它是如何适合的

101
00:06:05,310 --> 00:06:07,190
实际上构建你的原型。

102
00:06:07,510 --> 00:06:08,270
但请保留这个想法。

103
00:06:08,270 --> 00:06:11,990
我们将在两周后回来讨论这个问题，并把它演完。

104
00:06:12,190 --> 00:06:17,870
现在，我们正在应对技术挑战，构建一个转换 Python 代码的产品

105
00:06:17,870 --> 00:06:21,070
快速 C++ 代码以提高性能。

106
00:06:21,110 --> 00:06:26,040
假设我们不知道如何编写C++，我们知道如何编写Python，我们想要翻译它。

107
00:06:26,040 --> 00:06:31,280
您可以看到如何将其扩展到任何类型的移植代码平台。

108
00:06:31,600 --> 00:06:38,120
显然，我们都知道这是一个很好的用例，就像一个代理解决方案能够采取

109
00:06:38,160 --> 00:06:41,560
整个代码库并将其从一种技术移植到另一种技术。

110
00:06:41,560 --> 00:06:45,080
我们不会以一种真实的方式进行工作。

111
00:06:45,200 --> 00:06:50,640
我们假设我们只有一个 Python 脚本，并且希望将其转换为脚本

112
00:06:50,640 --> 00:06:51,640
在C++中。

113
00:06:51,800 --> 00:06:57,040
但你可能会想，如果你已经参加了一些像我这样的代理课程，或者也许你已经

114
00:06:57,040 --> 00:07:02,720
了解这一点，您可以自己将其扩展为一个完整的代理平台，如果没有，那么之后

115
00:07:02,720 --> 00:07:07,640
第八周，当我们建立一个小的代理流程时，你可以回来并在那里应用它

116
00:07:07,640 --> 00:07:08,560
真的很酷。

117
00:07:08,720 --> 00:07:14,320
但目前，我们只专注于 LM 选择并提出诸如“我们要如何进行”之类的问题

118
00:07:14,320 --> 00:07:19,240
测试业务目标以及我们如何针对不同模型验证它。

119
00:07:19,240 --> 00:07:23,720
当然，我们在这里试图解决的业务问题都与性能有关。

120
00:07:23,720 --> 00:07:26,200
我们出于商业目的而有这种需求。

121
00:07:26,200 --> 00:07:31,680
我们正在编写的代码需要运行得更快，这为我们提供了一种衡量成功的简单方法。

122
00:07:31,720 --> 00:07:35,440
我们可以确保答案准确且快速。

123
00:07:35,720 --> 00:07:37,720
这就是挑战。

124
00:07:37,960 --> 00:07:39,360
让我们开始解决它。

125
00:07:39,360 --> 00:07:46,040
我们将用来查看是否解决了这个问题的具体测试是我们有一点

126
00:07:46,040 --> 00:07:46,960
Python 代码在这里。

127
00:07:46,960 --> 00:07:49,320
这就是我们将用来验证的测试。

128
00:07:49,680 --> 00:07:52,960
它是进行大量计算的东西。

129
00:07:53,120 --> 00:08:00,520
它需要一个数学公式和一个像这样的循环数学，而循环是众所周知的Python不擅长的

130
00:08:00,520 --> 00:08:04,720
因为它都是被解释的并且是在循环上迭代的东西。

131
00:08:04,720 --> 00:08:09,920
如果你仔细查看代码，你会发现它基本上是在做一减三分之一加

132
00:08:09,920 --> 00:08:19,640
五分之一，减去七分之一，再加上九分之一，这样的过程持续了 100,000 次。

133
00:08:19,880 --> 00:08:25,320
最后，它获取结果并将其乘以四，然后将其打印出来

134
00:08:25,320 --> 00:08:26,560
花了多长时间。

135
00:08:26,880 --> 00:08:29,360
这就是我们的测试。

136
00:08:29,360 --> 00:08:32,680
这就是我们要做的，我们将看看我们的表现如何。