<!--                                                                                                                              
                                                                                                                             
                                                                                                                             
                                         ..;+$&& &&&&$Xx;                                                                  
                                      ..;+$&&&&&&&&&&&&&&&&&$Xx;                                                                  
                                      .x&&&&&&&&&&&&&&&&&&&&&&&&&&&&:                                                             
                                   .x&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&;                                                          
                                   X&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&;                                                       
                                 .x&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&X:                                                    
                                :X&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&x                                                   
                              :$&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&.                                                 
                             :$&&&&&&&&&&&&&$$$$$$$$$$$$$$&&&&&&&&&&&&&&&&&&&&&&&+                                                
                            ;$&&&&&&&&&$$$XXXXXXXxxxxxxXXXXXX$$$$&&&&&&&&&&&&&&&&&x                                               
                            X&&&&&&&&$$XXXXXXxXxxxxxxxxxxxxxxxxxxxxX$&&&&&&&&&&&&&&&                                              
                           :&&&&&&&$$$XXXXXXxxxxxxx+x++++++++++++xxxxxxX$&&&&&&&&&&&;                                             
                          .$&&&&&&$$$XXXXXxxxxxxxxxx++++++++++++++++++xxxx$&&&&&&&&&X                                             
                          $&&&&&&$$$XXXXxxxxxxxxx+++++++++++++++++++++++xxxx$&&&&&&&&                                             
                         :&&&&&&$$$XXXXXxxxxxxxxx+++++++++++++;+++++++++++xxxX$&&&&&&.                                            
                         $&&&&&$$$XXXXXXxxxxxxx++++++++++++++++++++++++++++xxxX$&&&&&+                                            
                        .&&&&&&$$XXXXXxxxxxxxxx++++++++++++;;+++++++++++++++xxxX$&&&&+                                            
                        ;&&&&&&$$XXXXxxxxxxxx+++++++++++++++++++++;++++++++++xxxX&&&&x                                            
                        X&&&&&$$XXXXXXXXxxxxx+++++;;+;;;;;;;;;++;;;;++++++++++xxX$&&&&.                                           
                        X&&&&&$XX$&&&&&&&&&$$Xxxx++++++;;;;;+++++;++++++++++++xxX$&&&&X                                           
                        X&&&&$X$&&&&&&&&&&&&&&&$$Xxxxx++++++++++++++++++++++xxxxx$&&&&$                                           
                        &&&&&XX$&&&$$$$$$$$$$&&$$$$XXXx+++++++xxxXXX$$$&&&$$$$$XxX&&&&+                                           
                        X&&&&XXXXXXXxxxx++xxXX$$$$XXXXxx++++xxXXXX$$$&&&&&&&&&&&Xx&&&&.                                           
                        +&&&XXxXXxxxxxx++++++xxxXXXXXxxx++++xxXXXXXXXXxxxxxxX$$$$X&&&x                                            
                        X&&&XXXXXxXX$XXXXxxxX$XxxXXXXxxx+++++xXXXXxxxx++++++++xxxx&&&;                                            
                       ;$&&XxxXXXX$$&&&&&&&&&&$$xXXXXXx++;+++xXXXX$$&&$$$$Xx++++++X&&                                             
                       X$&&xxxxXX$$$$$$&&&&&&X$&$+xxxXx++;+++xxxX&&&&&&&&$&&&$Xx++x&+                                             
                      ;$$&$XxxxxxxxxXxxXXXXxxx+++++xxxx++;++++++++xxX&&&&XXXXXXx+++&$:                                            
                      +$$$$xxxxxxx++xxxxxxxxxx++x+xxxxx++;;+++++++xxx++++++++++++++$$+                                            
                      .XX$$xxxxxxx+++++++++++++++xxxxxx++;+++++++++++xxx+++++++++++Xx+                                            
                       xX$$xxxxxxx++++++++++++++xxxxxxx++;;+++++++;+++;+;;;;;++++++x++                                            
                       ;XX$Xxxxxxx+++++++++++++xxxxxxxx++;+++++++++;;;;;;;;;;+++++++;.                                            
                        +X$XXxxxx+++++++++++++xxXXxxxxx+;;;++++xx+++;;;;;;++++++++++.                                             
                         +$XXXxxxx+++++++++++xxxxxxxxxx+;;;+++++xxx+++;;;+;;;++++++:                                              
                          XXXXxxxx+++++++++xxxxx+++xxxx++++++++++xxx++++++++++++++.                                               
                           ;XXXXxxxx++++xxxxxxxxxxxxxxxx++++++++++xxxx+++++++++++;                                                
                            xXXXXxxxxxxxxxxxxX$$$$&&&$$XXXX$&&$$Xx++xxxx+++++++++:                                                
                            +XXXXXXXXxXxxxxxxX$$$$$$$$$$$$$$$$$$X++++xxxxxxxxx+++                                                 
                            ;XXX$$XXXxxxxxxxxXXXXXXXXXXXXx++++++++++++xxxxxxxxx+;                              ;++;:              
                            .xXX$$$XxxxxxxxxXxxxxxxx++++++++++++++xxx++++xxxxx++                              ;xx++;;             
                             +XXX$XXxxxxxxXXXXxxxxxx++++++++++++++xxxxx+++xxxxx:            .                .xxx+++;             
                              XXXXXXXxxxxX$&&&&&&$$$$XxxxXX$$$$$$&&&$Xx++++xxx;           :+++;.             +xxxx++;             
                              .XXX$XXXxxxxxxXX$$$$$$$$&$$$XxXXXXx+xxXXxx+xxxx;            x+++;;             Xxx+x++:             
                               ;$$$$XXXxxxxxxxxXXX$$$XXxxxxXXxx++++++xxxxxxx+            .xx++;;.           :Xxxxx++.             
                                +$$$$$$XXxxxxxxxxXXXXXXXXXXxxxx++++++xxxxxx;             :xx+++;;           ;Xxxxxx+              
                                 $&$$$$$$XXxxxxxxxxXXXXXXXXxxxx++++xxxxxXx;              :x+++++;           xx+++++:              
                            ..   $&&&$$$$XXXxxxxxxxxxxxxxxxxxxxxxxxxxxxxX:               .Xx+++++          .xx+++++.              
                        X&&&&&&&&&&&&&&&$$XXXxxxxxxxxxxxxxxxxxxxxxxxxxx+                  XXxxx++.         +xx+++++.              
                      $&&&&&&&&&&&&$&&&&&$$$XXXxxxxxxxxxxxxxxxxxxxxXXX+                   +xx+++;;        .Xx++++++               
                   :$&&&&&&&&&&&&&&&&$&&&&&&$$XXXXXXXXXXXXxxxxXXXXXXXx.                   ;Xx+++++.       ;Xxx+++++               
                  $&&&&&&&&&&&&&&$$$&&&&&&&&&&&$$$XXXXXXXXXXXX$$$$$Xxx                    +Xx+++++;       xxx+xxx+;               
             .;&&&&&&&&&&&&&&&&&&$$$$$&&&&&&&&&&&&&&&$$$$$$&&&&$$XXxx+                    +Xxxxx+++      :Xxx+++++:               
       +$&&&&&&&&&&&&&&&&&&&&&&&&$$$$$$$&&&&&&&&&&&&&&&&&&&&&$$XXxxxx+                    .$Xxxx+++:     xXxx++++;.               
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&$$$$$$$$&&&&&&&&&&&&&&&&&&$$XXxxxxx;                     XXx+++++:    .XXxx++++;                
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$$XXX$$$$&&&&&&$$&&&&&$$$$Xxxxxxxx&.                    +Xx+++++;    ;XXxx++++:                
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&XXXXX$$$$$&&&&&&&$$$$$$XXXxxxxxX&&:                   ;Xxx+++++   .xXxxxxx++                 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&XxxxXXXX$$$$$$$$$$$XXXXxxxxxxx&&&&                   .$Xxx++++.  +xxxxxxx+;                 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&xxxxxxxxxxx+++x++xxxxxxxxxxx$&&&&&&&&&&&&X.        .XXxx+++++;;;;+++++++;                 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&x+xxxxxxxxxxxxx+xxxxxxxxxX&&&&&&&&&&&&&&&&&;     .$$Xx+++++++++++++++++;;::.            
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&+xxxxxxxx++xxxxxxxxxxXX$&&&&&&&&&&&&&&&&&&&.   .$Xxx++++++++++++++x+++xxxxxx+++       
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&Xxxxxxx+++++xxxxxxxXX$&&&&&&&&&&&&&&&&&&&&X  .$$Xxx++++++++++x++xxxXXxxXxx++;++.    
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$xxxxx+++++++xxxxX$$&$&&&&&&&&&&&&&&&&&&&&  $$Xx+++++++++++xx+XXX$$$X$Xx++++++.   
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&Xxx++++++++xxxX$$$$&&&&&&&&&&&&&&&&&&&&&:X$$x+x++xx+x++xxxxX$X$$$$$Xx++++++.   
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&Xx++++xxxX$$&&&&&&&&&&&&&&&&&&&&&&&&&$$X++x++xx+++xxxXX$$$$$$Xx+++++++.   
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$XXX+++++++++xxxXX$$$$$$Xx+++++++x;  
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$XX$X++++++++xxxXX$$$$$$x++++++++++; 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$Xxx$$x+++++xxxxX$$$$$$Xx+++++++++++:
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$Xxxx$Xx+++++xxxX$$$$$Xxx++++++++++++
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$Xxxxx$$x++++xXX$$$$$$Xxx+++++x+++++:
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&XXxxxxX$x+++xXXxxXXxxxxxx+;+xx++++; 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$XXxxxxxXXXXXxxxxXXXxx++++++xx++++: 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$XXXX$$$$$Xxx++xxxxxxx+++++xXxx++. 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$$$$$$$$$$Xx++++xxXXxxx++x+xXXxx:  
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$$$$$$$$$$Xxx+xxxxxxxxxxxXXXXx    
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$$$$$$$$$$$XxxxxxxxxxxXxxXXx+.     
    
    这些是HTML代码，真没啥好看的 - 杰
    
-->


<!-- 
conda换源：
conda config --show channels
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

pip换源：
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
-->


<!DOCTYPE html>
<html lang="zh-CN" color-mode="light">

<head>
  <meta charset="utf-8">
  <!-- <meta name="viewport" content="width=device-width, initial-scale=1" /> -->
  <meta name="viewport" content="width=device-width, initial-scale=0.8, maximum-scale=1, user-scalable=no">

  
  <meta name="author" content="杰" />
  <meta name="description" content="" />
  
  
  <title>
    
      大语言模型私有化部署+Langchain自然语言集成+Lora微调 
      
      
      |
    
     人工智能小站站
  </title>

  
    <link rel="apple-touch-icon" href="/images/favicon.png">
    <link rel="icon" href="/images/favicon.png">
  

  <!-- Raleway-Font -->
  <!-- <link href="https://fonts.googleapis.com/css?family=Raleway&display=swap" rel="stylesheet"> -->

  <!-- hexo site css -->
  <link rel="stylesheet" href="/css/main.css" />
  <link rel="stylesheet" href="//at.alicdn.com/t/font_1886449_67xjft27j1l.css" />

  <!-- <style>
    @font-face {
      font-family: 'NotoSansSC';
      src: url('https://pub-0a02c629549c4638b41011dd3ce66f6a.r2.dev/NotoSansSC-Regular.ttf') format('truetype');
    }

    body {
      font-family: NotoSansSC,sans-serif;
    }
  </style> -->

  <!-- 代码块风格 -->
  

  <!-- jquery3.3.1 -->
  
    <script defer type="text/javascript" src="/plugins/jquery.min.js"></script>
  

  <!-- fancybox -->
  
    <link href="/plugins/jquery.fancybox.min.css" rel="stylesheet">
    <script defer type="text/javascript" src="/plugins/jquery.fancybox.min.js"></script>
  
  
<script src="/js/fancybox.js"></script>


  <script>
    var html = document.documentElement
    const colorMode = localStorage.getItem('color-mode')
    if (colorMode) {
      document.documentElement.setAttribute('color-mode', colorMode)
    }
  </script>
<!-- hexo injector head_end start -->
<link rel="stylesheet" href="/plugins/katex/dist/katex.min.css">

<link rel="stylesheet" href="/plugins/hexo-math/dist/style.css">
<!-- hexo injector head_end end --><meta name="generator" content="Hexo 7.3.0"></head>


  <body>
    <div id="app">
      <div class="header">
  <div class="avatar">
    <a href="/">
      <!-- 头像取消懒加载，添加no-lazy -->
      
        <img src="/images/avatar.webp" alt="">
      
    </a>
    <div class="nickname"><a href="/">hahaha.love 个人学习笔记</a></div>
  </div>
  <div class="navbar">
    <ul>
      
        <li class="nav-item" data-path="/">
          <a href="/">首页</a>
        </li>
      
        <li class="nav-item" data-path="/tags/编程语言/">
          <a href="/tags/编程语言/">编程语言</a>
        </li>
      
        <li class="nav-item" data-path="/archives/">
          <a href="/archives/">日期归档</a>
        </li>
      
        <li class="nav-item" data-path="/tags/">
          <a href="/tags/">标签</a>
        </li>
      
        <li class="nav-item" data-path="/life/">
          <a href="/life/">生活</a>
        </li>
      
        <li class="nav-item" data-path="/software/">
          <a href="/software/">软件下载</a>
        </li>
      
        <li class="nav-item" data-path="/about/">
          <a href="/about/">关于我</a>
        </li>
      
    </ul>
  </div>
</div>


<script src="/js/activeNav.js"></script>


        <div class="flex-container">
          <!-- 文章详情页，展示文章具体内容，url形式：https://yoursite/文章标题/ -->
<!-- 同时为「标签tag」，「朋友friend」，「分类categories」，「关于about」页面的承载页面，具体展示取决于page.type -->


  <!-- LaTex Display -->

  
    <script async type="text/javascript" src="/plugins/mathjax/tex-chtml.js"></script>
  
  <script>
    MathJax = {
      tex: {
        inlineMath: [['$', '$'], ['\\(', '\\)']]
      }
    }
  </script>


        <!-- clipboard -->

  
    <script async type="text/javascript" src="/plugins/clipboard.min.js"></script>
  
  
<script src="/js/codeCopy.js"></script>


                                  <!-- 文章内容页 url形式：https://yoursite/文章标题/ -->
                                  <div class="container post-details" id="post-details">
                                    <div class="post-content">
                                      <div class="post-title">大语言模型私有化部署+Langchain自然语言集成+Lora微调</div>
                                      <div class="post-attach">
                                        <span class="post-pubtime">
                                          <i class="iconfont icon-updatetime mr-10" title="更新时间"></i>
                                          2024-10-22 14:52:45
                                        </span>
                                        
                                          <span class="post-tags">
                                            <i class="iconfont icon-tags mr-10" title="标签"></i>
                                            
                                              <span class="span--tag mr-8">
                                                <a href="/tags/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/" title="人工智能">
                                                  #人工智能
                                                </a>
                                              </span>
                                              
                                              <span class="span--tag mr-8">
                                                <a href="/tags/LLM/" title="LLM">
                                                  #LLM
                                                </a>
                                              </span>
                                              
                                          </span>
                                          
                                      </div>
                                      <div class="markdown-body">
                                        <h2 id="前言"><a href="#前言" class="headerlink" title="前言"></a>前言</h2><p> <span style='display: inline-block; width: 3.6rem;'></span>近年来，大家可以察觉到生成式AI发展得非常迅猛：有视觉的、文本大语言的、语音的、音乐的等等。市场上有很多大型语言模型可以选择，有些是开源的，有些不是开源的， 以至于容易令许多开发者产生疑问：我该使用哪一个大语言模型呢？</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/What-is-Artificial-Itelligence.jpg" alt="Types of Artificial Intelligence: Details That Everyone Should Know - Aiiot  Talk"></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>那么现在的大语言模型参数量是如何？我们应该如何选择？</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>若你想拥有一个大语言模型，能够掌握世界上的各种海量知识时，比如关于历史、哲学、天文、地理、亦或是让其编写Python代码等的东西时。 使用一个包含数千亿个参数的巨型模型是不错的方案。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>但是对于单项任务，例如我只需要进行信息提取或让大模型充当一家公司在线智能客服来回答客户问到的公司产品问题的时候，对于这样的需求， 则不需要大语言模型，使用参数更少的模型也能完成相同的任务。 </p>
<p>我们讨论一下大语言模型在日常生活中的应用与任务：</p>
<p>聊天机器人<br><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/Screenshot-from-2019-09-20-16-23-04.png" alt="Deep Learning Based Chatbots are Smarter - open source for you"></p>
<p>从文本生成图像<br><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/EffUZSQZq0c2xWH8d_Fek-1704682350338.jpeg" alt="Diffusion model Spaces - a hysts Collection"></p>
<p>结合编程插件来让大语言模型辅助写代码<br><img src="https://www.researchgate.net/publication/373518279/figure/fig1/AS:11431281184804895@1693451253171/Code-generation-by-LLM-ChatGPT.ppm" alt="Code generation by LLM (images/大语言模型私有化部署及微调/Code-generation-by-LLM-ChatGPT.ppm) | Download Scientific Diagram"></p>
<p>翻译<br><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/helping-you-is-my-goal-i-translate-your-texts.png" alt="Translate your texts in 4 languages by Parsa07 | Fiverr"></p>
<p>信息摘要<br><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/tr7723-Hero-AI-summaries.jpg" alt="3 Free Ways to Get an AI Summary of a Long Web Article"></p>
<p>信息提取<br><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/archetype-llm-batch-use-case-high-level-batch.png.webp" alt="How to Extract Structured Data from Unstructured Text using LLMs - Xebia"></p>
<p>生成文章<br><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704683260717.png" alt="1704683260717"></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>从这些工具中看到生成式AI是一个 <strong>能够创建模仿或近似人类能力的内容</strong> 的机器。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>生成式 AI 是传统机器学习的一个子集。 通过在最初由人类编写的海量内容数据集中通过发现、统计其中的模式来学习人类的能力。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>大语言模型在算力允许的前提下，能在数周和数月内完成对数万亿个单词的训练。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>而这些基础模型，具有数十亿个参数，除了语言之外，还表现出新出现的特性。研究人员正在激发大语言模型的潜能，使之拥有分解、推理和解决复杂任务能力。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>以下是基础模型的集合，有时也称为基础模型，以及它们在参数方面的相对大小。 稍后你将更详细地介绍这些参数，但现在可以把参数当作模型的所占的内存空间。 </p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/2023-Alan-D-Thompson-AI-Bubbles-Rev-7b.png" alt="img"></p>
<p>可以通过以下几个模型观察，大模型学习的知识库中各种语言的占比。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704640801920.png" alt="1704640801920"></p>
<p>若在本机进行实验的话，我们可以选用开源的大语言模型例如<strong>Flan-t5</strong>来执行语言任务。</p>
<p>一个缩小版的”大语言模型”部署：可以将如下代码复制到Jupyter Notebook中执行。</p>
<figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> transformers <span class="keyword">import</span> AutoModelForSeq2SeqLM, AutoTokenizer</span><br><span class="line"></span><br><span class="line">model = AutoModelForSeq2SeqLM.from_pretrained(<span class="string">&quot;google/flan-t5-small&quot;</span>)</span><br><span class="line">tokenizer = AutoTokenizer.from_pretrained(<span class="string">&quot;google/flan-t5-small&quot;</span>)</span><br><span class="line"></span><br><span class="line">inputs = tokenizer(<span class="string">&quot;what your name?&quot;</span>, return_tensors=<span class="string">&quot;pt&quot;</span>)</span><br><span class="line">outputs = model.generate(**inputs)</span><br><span class="line"><span class="built_in">print</span>(tokenizer.batch_decode(outputs, skip_special_tokens=<span class="literal">True</span>))</span><br></pre></td></tr></table></figure>

<p>此段代码中的模型可以替换成：</p>
<ul>
<li><a target="_blank" rel="noopener" href="https://huggingface.co/google/flan-t5-small">google&#x2F;flan-t5-small</a></li>
<li><a target="_blank" rel="noopener" href="https://huggingface.co/google/flan-t5-base">google&#x2F;flan-t5-base</a></li>
<li><a target="_blank" rel="noopener" href="https://huggingface.co/google/flan-t5-large">google&#x2F;flan-t5-large</a></li>
<li><a target="_blank" rel="noopener" href="https://huggingface.co/google/flan-t5-xl">google&#x2F;flan-t5-xl</a></li>
<li><a target="_blank" rel="noopener" href="https://huggingface.co/google/flan-t5-xxl">google&#x2F;flan-t5-xxl</a>.</li>
</ul>
<p> <span style='display: inline-block; width: 3.6rem;'></span>我们可以直接使用这些模型，亦或通过应用微调技术让它们适用于特定用例，用现有的大语言模型可以快速构建自定义解决方案，从而无需从头开始训练新模型。 </p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>现在，虽然生成式AI有针对不同的领域，如生成图像、视频、音频和语音这些。但在本课程中，将重点介绍大型语言模型及其在自然语言生成中的用途。 </p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>在这个课程中，将看到大语言模型是如何构建和训练的，如何通过提示文本与大语言模型互动、如何针对你的用例对大语言模型微调模型、如何将它们与应用程序一起部署以解决业务和社交任务。 </p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>与大语言模型交互的方式跟其他机器学习和编程范式是截然不同的。 </p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>在传统的编程情况下，我们通常需要使用具体的编程语法去编写计算机代码来调用库和API进行交互。相比之下，大型语言模型能够像人类一样可以接受自然语言或人类书面指令去执行任务。 </p>
<p>通过例子来提前说明一些关于LLM名词，例子：现在要求模型回答一个问题：”明天星期日，后天星期几？”，将这句提示词传递给模型，让模型给出答案。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>而我们传递给 LLM 的文本称为<strong>提示词（Prompt）</strong>。 </p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>提示词可用的空间或内存称为<strong>上下文窗口（Context Window）</strong>，它通常足够容纳几千个单词，但大语言模型的型号不同而不同。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>在这个过程中，模型的输出称为<strong>完成（Completion）</strong>、模型生成文本的行为称为<strong>推理（Inference）</strong>，完成由原始提示中包含的文本和生成的文本所组成。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/ea3523e7-7dea-4f2c-87aa-61932510c7d1.png" alt="What is Prompt Engineering ?"></p>
<h2 id="第一章-ChatGLM、LangChain、Azure-OpenAI、向量数据库的基础介绍"><a href="#第一章-ChatGLM、LangChain、Azure-OpenAI、向量数据库的基础介绍" class="headerlink" title="第一章 ChatGLM、LangChain、Azure OpenAI、向量数据库的基础介绍"></a>第一章 ChatGLM、LangChain、Azure OpenAI、向量数据库的基础介绍</h2><h3 id="1-1-ChatGLM3介绍"><a href="#1-1-ChatGLM3介绍" class="headerlink" title="1.1 ChatGLM3介绍"></a>1.1 ChatGLM3介绍</h3><p>github地址：<a target="_blank" rel="noopener" href="https://github.com/THUDM/ChatGLM-6B">https://github.com/THUDM/ChatGLM-6B</a></p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704683476641.png" alt="1704683476641"></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>ChatGLM3是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型，其系列中的开源模型 ChatGLM3-6B，在继承了前两代模型如对话流畅性和低部署门槛等优点的基础上，带来了以下新特性：</p>
<ol>
<li>更强大的基础模型：ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base，使用了更加多样化 training data，更充分的训练步数，以及更合理的训练策略。</li>
<li>更完整的功能支持：ChatGLM3-6B 采用了全新设计的 Prompt 格式，除了能够进行正常的多轮对话外，还原生支持工具调用（Function Call）、代码执行（Code Interpreter）和 Agent 任务等复杂场景的需求。</li>
<li>更全面的开源序列：此次不仅开源了对话模型 ChatGLM3-6B，还包括了基础模型 ChatGLM3-6B-Base 和长文本对话模型 ChatGLM3-6B-32K。所有开源模型的权重都对学术研究完全开放，且在完成问卷登记后，也允许免费商业使用。</li>
</ol>
<h3 id="1-2-LangChain介绍"><a href="#1-2-LangChain介绍" class="headerlink" title="1.2 LangChain介绍"></a>1.2 LangChain介绍</h3><p>官网地址：<a target="_blank" rel="noopener" href="https://www.langchain.com/">https://www.langchain.com/</a></p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/LangChain-announces-partnership-with-deepsense.jpeg" alt="LangChain Announces Partnership with deepsense.ai - deepsense.ai"></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>LangChain 是一个开源框架，它可以帮助软件开发人员将大型语言模型（LLM）与自家的软件产品相结合，使得LLM能集成和应用到自己的应用程序中去。应用程序可以利用LLM的强大能力，如OpenAI的GPT-3.5和GPT-4，来处理自然语言处理（NLP）任务。</p>
<p>LangChain 的主要特点包括：</p>
<ul>
<li><p>集成外部数据源：LangChain 允许开发者将LLM与各种外部数据源和API集成，从而创建功能丰富的NLP应用程序。</p>
</li>
<li><p>多语言支持：LangChain 提供了Python、JavaScript和TypeScript等多种编程语言的软件包，使得不同背景的开发者都能够使用这个框架。</p>
</li>
<li><p>开源项目：LangChain 由联合创始人 Harrison Chase 和 Ankush Gola 于2022年推出，作为一个开源项目，它的初始版本也在同一年发布。</p>
</li>
<li><p>易于使用：LangChain 设计为易于使用，使得即使是没有深度学习背景的开发者也能够轻松地构建和部署LLM驱动的应用程序。</p>
</li>
</ul>
<h3 id="1-3-Azure-OpenAI介绍"><a href="#1-3-Azure-OpenAI介绍" class="headerlink" title="1.3 Azure OpenAI介绍"></a>1.3 Azure OpenAI介绍</h3><p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/cursos-propios-Azure-openAI.jpg" alt="img"></p>
<p>Azure OpenAI 是在微软的 Azure 云平台上提供的ChatGPT服务，开发人员可以轻松地将 GPT-3.5 集成到自己的应用程序中。</p>
<h4 id="1-3-1-注册-Azure-账号"><a href="#1-3-1-注册-Azure-账号" class="headerlink" title="1.3.1 注册 Azure 账号"></a>1.3.1 注册 Azure 账号</h4><p>注册国版 Azure 账号</p>
<p>Azure OpenAI Service 是 Azure Cognitive Services 的一部分，所以需要先注册 Azure 账号。目前只在 Azure 国际版上提供，所以请到 <a target="_blank" rel="noopener" href="https://azure.microsoft.com/">Azure 国际版</a> 上注册账号。</p>
<p>地区与手机号验证</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/azure-phone-number-region-code.jpg" alt="Azure Phone Number"></p>
<p>注册时可以选择 <strong>中国</strong> 地区，这样你可以直接输入 <code>+86</code> 的手机号进行验证。注册中国地区的账号也可以申请 Azure OpenAI Service。</p>
<h4 id="1-3-2-信用卡验证"><a href="#1-3-2-信用卡验证" class="headerlink" title="1.3.2 信用卡验证"></a>1.3.2 信用卡验证</h4><p>账单地址应该与你选 <strong>国家&#x2F;地区</strong>保持一致，否则会提示注册失败。</p>
<h4 id="1-3-3-申请-Azure-OpenAI-Service-试用"><a href="#1-3-3-申请-Azure-OpenAI-Service-试用" class="headerlink" title="1.3.3 申请 Azure OpenAI Service 试用"></a>1.3.3 申请 Azure OpenAI Service 试用</h4><p><a target="_blank" rel="noopener" href="https://azure.microsoft.com/en-us/products/cognitive-services/openai-service">Azure OpenAI Service</a> 目前需要以企业的身份来申请试用。如果你的 Azure 账号已经注册好了，可以点击 <a target="_blank" rel="noopener" href="https://go.microsoft.com/fwlink/?linkid=2222006&clcid=0x409&culture=en-us&country=us">这里</a> 来申请。</p>
<p>Azure OpenAI Service 接受来自中国的企业申请，请依照表单 <code>如实填写</code> 信息，其中最重要的是：</p>
<ul>
<li>Your Company Email Address：请填写你在你公司的企业邮箱地址。</li>
<li>Your Company Name：请填写你所在公司的名称。</li>
<li>Azure Subscription ID：请根据表单内的提示来获取你的 Azure <code>Subscription ID</code>，千万不要填错成 <code>Tenant ID</code> 了，否则无法通过或者看不到订价层。</li>
<li>Company Website：请填写你所在公司的网站的网址。网址里最好能展示一个与你企业邮箱地址同一个域名的邮箱地址。</li>
<li>你的企业邮箱的域名、公司网站的域名需要保持一致，域名的主体需要与公司的名称保持一致，否则会在审核时被拒绝。</li>
<li>如果你填写的资料存在明显的问题，Azure 甚至不会给你任何回复。</li>
<li>如果你填写的资料还需要进一步的证明材料，Azure 会给你发送邮件要求提供。</li>
</ul>
<p>运气好的话，一般两天能通过审核，如果超过两周没有收到审核结果，请尝试重新提交申请。</p>
<h4 id="1-3-4-部署-Azure-OpenAI-Service"><a href="#1-3-4-部署-Azure-OpenAI-Service" class="headerlink" title="1.3.4 部署 Azure OpenAI Service"></a>1.3.4 部署 Azure OpenAI Service</h4><p>恭喜你已经申请到了 Azure OpenAI Service 的试用资格，接下来就是部署 Azure OpenAI Service 了。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/azure-services.jpg" alt="Azure services"></p>
<p>登录到 Azure 以后，你会在首页的 <code>Azure services</code> 里面看到 <code>Azure OpenAI</code> 的图标，点击进入来创建部署 OpenAI Service 资源。</p>
<ul>
<li>在创建Azure OpenAI的页面，订阅<code>-</code>资源组一栏如果没有，新建一个即可。</li>
<li>在名称一栏根据要求输入一个简短好记的资源名，未来需要通过它来访问你的私有 OpenAI API。</li>
<li>定价层选择默认选项。</li>
<li>标记一页，如果你不需要通过 tags 来管理自己的资源，可暂时不填。</li>
<li>在审阅+提交之后，即可进入部署阶段，部署资源需要几分钟时间，请耐心等待，待部署成功之后便可开始使用。</li>
</ul>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704706787244.png" alt="1704706787244"></p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704706803989.png" alt="1704706803989"></p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704706832044.png" alt="1704706832044"></p>
<h3 id="1-4-向量数据库介绍"><a href="#1-4-向量数据库介绍" class="headerlink" title="1.4 向量数据库介绍"></a>1.4 向量数据库介绍</h3><p> <span style='display: inline-block; width: 3.6rem;'></span>在人工智能和机器学习领域，向量数据库扮演着至关重要的角色，尤其是在处理非结构化数据，如文本、图像和音频时。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>向量数据库的核心功能是将各类数据转换成向量形式，这些向量在数学上表示为高维空间中的点。每个向量捕获了数据的含义和上下文信息，使得我们可以通过计算向量之间的距离来找到相似的数据点。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/651dad0a39fdbecaef189693_choosing_a_vector_database.webp" alt="Why You Shouldn&#39;t Invest In Vector Databases? By Yingjun Wu, 54% OFF"></p>
<h2 id="第二章-大型语言模型-LLM-的基本原理"><a href="#第二章-大型语言模型-LLM-的基本原理" class="headerlink" title="第二章 大型语言模型(LLM)的基本原理"></a>第二章 大型语言模型(LLM)的基本原理</h2><h3 id="2-1-分词器"><a href="#2-1-分词器" class="headerlink" title="2.1 分词器"></a>2.1 分词器</h3><p> <span style='display: inline-block; width: 3.6rem;'></span>从采集数据开始，投喂给大语言模型进行训练的过程，需要将句子传递到分词器（Tokenizer ），分词器会将每个词语转换成数字表示。对于像我们后续介绍到的Transformer模型，需要确保，训练、输入、生成过程，所使用的分词器必须是统一规则的。</p>
<p>例子：</p>
<p>老 四 川 菜 馆 ，可分词为：</p>
<p>“老”，”四川菜馆”</p>
<p>“老四”，”川菜馆”</p>
<p>“老四川”，”菜馆”</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704698508610.png" alt="1704698508610"></p>
<p>这苹果不大好吃，可分词为：</p>
<p>“这苹果”，”不大好吃”</p>
<p>“这苹果”，”不大”，”好吃”</p>
<p>“这苹果不大好”，”吃”</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/u=753709456,283504735&fm=253&fmt=auto&app=138&f=JPEG.jpg" alt="img"></p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/f9b6935ab929a71ba1ed0bb197453000.png" alt="img"></p>
<table>
<thead>
<tr>
<th>分词器类型</th>
<th>分词器例子</th>
<th>优势</th>
<th>局限性</th>
</tr>
</thead>
<tbody><tr>
<td>基于词典的分词器</td>
<td>最大正向匹配（MM）\ 最大逆向匹配（MRM）</td>
<td>词典更新灵活，易于实现</td>
<td>对未知词处理不佳</td>
</tr>
<tr>
<td>基于统计的分词器</td>
<td>隐马尔可夫模型（HMM）\ 条件随机场（CRF）</td>
<td>对未知词有较好处理能力</td>
<td>需要大量已标注数据</td>
</tr>
<tr>
<td>基于理解的分词器</td>
<td>语义分析分词器</td>
<td>可以理解句子含义，分词准确</td>
<td>实现复杂，计算成本高</td>
</tr>
<tr>
<td>基于机器学习的分词器</td>
<td>决策树分词器\神经网络分词器</td>
<td>可以从数据中学习分词规则</td>
<td>需要大量训练数据</td>
</tr>
<tr>
<td>子词分词器</td>
<td>WordPiece分词器\Byte Pair Encoding（BPE）</td>
<td>处理未知词能力强</td>
<td>可能产生大量子词单元</td>
</tr>
<tr>
<td>特定领域的分词器</td>
<td>医学分词器\法律分词器</td>
<td>包含领域特定词汇和规则</td>
<td>通用性差，仅适用于特定领域</td>
</tr>
</tbody></table>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704649311388.png" alt="1704649311388"></p>
<h3 id="2-2-词嵌入-Word-Embedding"><a href="#2-2-词嵌入-Word-Embedding" class="headerlink" title="2.2 词嵌入(Word Embedding)"></a>2.2 词嵌入(Word Embedding)</h3><p> <span style='display: inline-block; width: 3.6rem;'></span>词嵌入就像是把词汇放进了一个大型的坐标系里，每个词都对应一个特定的点。这个坐标系是根据词的语义和用法来设计的，所以相似的词在坐标系里的位置会比较接近。比如，“猫”和“狗”在坐标系里的位置就会比较近，因为它们都是宠物的意思。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>这个技术的关键在于，它不仅仅考虑了一个词本身的意思，还考虑了这个词是怎么和其他词一起出现的，也就是它的上下文。这样，即使两个词看起来意思不一样，但如果它们经常一起出现，它们在坐标系里的位置也会比较近。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>举个例子，比如“银行”和“贷款”，虽然它们是两个不同的词，但因为在很多句子中它们都会一起出现，比如“我去银行申请贷款”，所以它们在坐标系里的位置就会比较近。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>词嵌入的好处是，它可以帮助计算机更好地理解语言，就像我们人类理解语言一样。这样，计算机就可以更准确地完成一些任务，比如语音识别、文本分析、机器翻译等。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>词嵌入的训练通常需要大量的文本数据，通过这些数据，算法可以学习到词与词之间的关系，并把它们编码到向量中。现在有很多种词嵌入的方法，比如Word2Vec、BERT等，它们都有自己的特点，但共同的目标都是更好地捕捉词的语义和上下文信息。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>所以，词嵌入就是让计算机能够理解词汇背后的含义和关系的一种技术，它为计算机处理语言提供了非常重要的工具。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704650417011.png" alt="1704650417011"></p>
<h3 id="2-3-位置编码（Position-Encoding）"><a href="#2-3-位置编码（Position-Encoding）" class="headerlink" title="2.3 位置编码（Position Encoding）"></a>2.3 位置编码（Position Encoding）</h3><p> <span style='display: inline-block; width: 3.6rem;'></span>Transformer的Position Encoding是通过将位置信息编码到嵌入向量中来完成的。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>在Transformer模型中，位置编码（Positional Encoding）是一种用于给模型提供序列中各个位置的相对或绝对位置信息的方法。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>这种信息对于模型理解序列中词汇的顺序和上下文关系至关重要。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>一般而言，位置嵌入是通过正弦和余弦函数与位置的线性组合来构造的，并且将位置向量与词嵌入向量相加或进行某种形式的合并，以便在模型的其他部分（如自注意力机制）中使用。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/PE3.png" alt="A Gentle Introduction to Positional Encoding in Transformer Models, Part 1  - MachineLearningMastery.com"></p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704684162235.png" alt="1704684162235"></p>
<h3 id="2-4-Transformer模型"><a href="#2-4-Transformer模型" class="headerlink" title="2.4 Transformer模型"></a>2.4 Transformer模型</h3><p> <span style='display: inline-block; width: 3.6rem;'></span>实时上，生成算法在很久之前就已经出现了。前几代语言模型使用了一种称为循环神经网络或RNN的架构。</p>
<p>RNN：循环神经网络（Recurrent Neural Network）</p>
<p>LSTM：长短时记忆模型（Long Short Term Memory）</p>
<p>GRU：门控循环单元结构（Gate Recurrent Unit）</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1697871774122.png" alt="img"></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>RNN虽然在当时很强大，但若要生成表现出色的任务时候需更多算力或内存量。 让我们来看一个RNN执行一个简单的下一词预测生成任务的示例。</p>
<table>
<thead>
<tr>
<th>效果</th>
<th>上下文长度</th>
</tr>
</thead>
<tbody><tr>
<td>——————- 尝起来 ____。</td>
<td>短</td>
</tr>
<tr>
<td>——————- 这杯饮料尝起来 __很好__。</td>
<td>中</td>
</tr>
<tr>
<td>放坏的这杯饮料尝起来 __很好__。</td>
<td>长</td>
</tr>
</tbody></table>
<p> <span style='display: inline-block; width: 3.6rem;'></span>如果模型只看到前面一句话的一部分的时候 ，预测就不可能非常好。 当你扩展 RNN 实现以便能够在文本中看到更多前面的单词时，你必须大幅扩展模型使用的资源。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>尽管你将模型变得更大，但它仍然没有看到足够的输入，来做出良好的预测。为了成功预测下一个单词， 模型需要看到的不仅仅是前几个单词。 模型需要理解整句话甚至整个文档。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>而且这里的问题是语言很复杂。在许多语言中，一个词可以有多种含义。这些是同音异义词。 </p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>以这句话为例， “意思意思是什么意思？”。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/3c81b1b9a9cb766b227aed1493570e53_610_610.jpg!ys" alt="img"></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>在2017年，在谷歌和多伦多大学发表这篇论文《注意力就是你所需要的》之后， 一切都变了，Transformer直译过来是变形金刚。Transformer架构已经到来。 这种新颖的方法开启了我们今天看到的生成式人工智能的进步。 </p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>它可以有效地扩展以使用多核 GPU，它可以并行处理输入数据，利用更大的训练数据集，而且至关重要的是，它能够学会注意正在处理的单词的含义。 </p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>Transformer是一种基于多头注意力机制的深度学习架构，由谷歌和多伦多大学于2017年提出，并在《Attention is All You Need》论文中详细描述。该架构在生成人工智能领域取得了显著进展，引领了今天许多领域的发展。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/transformers-thumbnail-1654818516621.jpg" alt="How to Watch the Transformers Movies in Chronological Order - IGN"></p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704649281977.png" alt="1704649281977"></p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/attention_research_1.png" alt="The Transformer Model - MachineLearningMastery.com"></p>
<p>如下图所示，当输入这句话到大语言模型的时候：”many people dislike steve jobs, while acknowledging his genius”，每一个单词就会按照相关性找到其它单词，无论该单词在那个位置。可以看到每个单词之间的关系是由权重来决定的。这些注意力权重是在大语言模型训练时确定的。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704710641335.png" alt="1704710641335"></p>
<h3 id="2-5-什么是Transformer的多头注意力机制？"><a href="#2-5-什么是Transformer的多头注意力机制？" class="headerlink" title="2.5 什么是Transformer的多头注意力机制？"></a>2.5 什么是Transformer的多头注意力机制？</h3><p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704650491342.png" alt="1704650491342"></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>Transformer 中的多头注意力机制（Multi-Head Attention）是一种注意力分配机制，它允许模型在处理输入序列时同时关注多个不同的表示子空间。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>这种机制在 Transformer 模型中起到了关键作用，使得模型能够有效地捕捉序列中的复杂依赖关系。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>多头注意力机制的核心思想是将注意力分为多个“头”，每个头关注输入序列的不同部分。这些头是并行工作的，每个头都有自己的查询（Query）、键（Key）和值（Value）矩阵。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>通过对这些矩阵进行线性变换，可以得到每个头对应的注意力权重。然后，将权重与值矩阵相乘，得到加权的输出值，最后将所有头的输出值进行拼接，得到最终的输出。</p>
<p>用一张图来更进一步理解：</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704650515872.png" alt="1704650515872"></p>
<h3 id="2-6-Transformer的模型分类"><a href="#2-6-Transformer的模型分类" class="headerlink" title="2.6 Transformer的模型分类"></a>2.6 Transformer的模型分类</h3><h4 id="2-6-1-序列到序列模型"><a href="#2-6-1-序列到序列模型" class="headerlink" title="2.6.1 序列到序列模型"></a>2.6.1 序列到序列模型</h4><p> <span style='display: inline-block; width: 3.6rem;'></span>seq2seq模型，简单来说，就是一个用来处理像文本或者时间序列这类序列数据的深度学习模型。比如机器翻译、语音识别、文本摘要这些任务，它都能搞定。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>这个模型主要分成两大部分：编码器和解码器。编码器的作用是接收输入的序列，然后把它转化成一个固定长度的向量，这个向量就包含了输入序列的所有信息。解码器呢，就是用这个向量来生成我们想要的输出序列。它一次生成一个元素，然后把这些元素连起来，形成我们想要的序列。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>在训练这个模型的时候，我们一般会用一个叫“教师强制”的方法，就是让模型每次都接收真实的序列数据，这样它就能慢慢学会怎么生成正确的序列了。等到模型训练好了，我们让它自己生成序列，这时候它就不需要外界输入了，而是利用自己之前学到的知识来生成序列。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>此外，还有一些改进的版本，比如加入注意力机制，这个机制能让模型更关注输入序列中重要的部分，从而提高生成的质量。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704650544856.png" alt="1704650544856"></p>
<p>用途：翻译（将德语翻译成英语）</p>
<h4 id="2-6-2-只有编码器模型"><a href="#2-6-2-只有编码器模型" class="headerlink" title="2.6.2 只有编码器模型"></a>2.6.2 只有编码器模型</h4><p> <span style='display: inline-block; width: 3.6rem;'></span>这通常被称为“编码器-解码器”（Encoder-Decoder）模型或者“序列编码器”（Sequence Encoder）模型。在这种情况下，你只保留了Seq2Seq模型中的编码器部分，用来处理输入序列，并将其转换为上下文向量。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>这种简化模型的用途通常有限，因为它只能编码输入序列，而不能生成输出序列。然而，在某些情况下，这种模型还是有用的，比如：</p>
<ul>
<li>序列分类：你可以使用编码器来提取序列的特征表示，然后将这些特征输入到一个分类器中，用于对序列进行分类。</li>
<li>序列标注：在序列标注任务中，编码器可以用来生成每个时间步的特征表示，然后这些特征可以用来预测序列中每个时间步的标签。</li>
<li>上下文感知的嵌入：编码器可以用来生成序列的上下文感知嵌入，这些嵌入可以用于其他下游任务，如推荐系统或者序列相似性分析。</li>
<li>对话系统：在对话系统中，编码器可以用来理解用户的输入，然后根据这个理解生成响应。</li>
</ul>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704650555746.png" alt="1704650555746"></p>
<p>用途：适用于分类任务（情感分析）BERT就是一个很好用的仅有编码器的模型</p>
<h4 id="2-6-3-只有解码器模型"><a href="#2-6-3-只有解码器模型" class="headerlink" title="2.6.3 只有解码器模型"></a>2.6.3 只有解码器模型</h4><p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704650599429.png" alt="1704650599429"></p>
<p>用途：适用于生成文本，是最常用的模型之一。例如GPT、Llama等等</p>
<h3 id="2-7-提示词工程师工作内容"><a href="#2-7-提示词工程师工作内容" class="headerlink" title="2.7 提示词工程师工作内容"></a>2.7 提示词工程师工作内容</h3><p> <span style='display: inline-block; width: 3.6rem;'></span>在使用语言模型时，我们通常将输入的文本称为“提示”（prompt）。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>而模型根据提示生成文本的过程被称作“推理”（inference）。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>模型输出的文本结果则被称为“完成”（completion）。</p>
<p>在模型进行推理时，所能考虑的提示内容的全部范围，或者是模型可以访问的内存空间，被定义为“上下文窗口”（context window）。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>在实际应用中，我们可能会遇到模型初次生成的文本并不完全符合预期的情况。这时候，可能需要我们多次调整和优化提示的语言表达或编写方式，以便更好地引导模型生成我们想要的文本结果。这个过程涉及到的技术活动，我们称之为“提示工程”（prompt engineering）。它是建立和改进有效提示的关键步骤，对于提升模型生成文本的质量和效果至关重要。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704650621392.png" alt="1704650621392"></p>
<h2 id="第三章-大语言模型本地化搭建"><a href="#第三章-大语言模型本地化搭建" class="headerlink" title="第三章 大语言模型本地化搭建"></a>第三章 大语言模型本地化搭建</h2><h3 id="3-1-ChatGLM3-6B部署"><a href="#3-1-ChatGLM3-6B部署" class="headerlink" title="3.1 ChatGLM3-6B部署"></a>3.1 ChatGLM3-6B部署</h3><h4 id="3-1-1-硬件环境"><a href="#3-1-1-硬件环境" class="headerlink" title="3.1.1 硬件环境"></a>3.1.1 硬件环境</h4><p>最低要求：</p>
<p>为了能够流畅运行 Int4 版本的 ChatGLM3-6B，我们在这里给出了最低的配置要求：</p>
<p>内存：&gt;&#x3D; 8GB</p>
<p>显存:  &gt;&#x3D; 5GB（1060 6GB,2060 6GB）</p>
<p>为了能够流畅运行 FP16 版本的，ChatGLM3-6B，我们在这里给出了最低的配置要求：</p>
<p>内存：&gt;&#x3D; 16GB</p>
<p>显存:  &gt;&#x3D; 13GB（4080 16GB）</p>
<h4 id="3-1-2-软件要求"><a href="#3-1-2-软件要求" class="headerlink" title="3.1.2 软件要求"></a>3.1.2 软件要求</h4><table>
<thead>
<tr>
<th>所需软件</th>
<th>版本</th>
</tr>
</thead>
<tbody><tr>
<td>Conda</td>
<td>conda3</td>
</tr>
<tr>
<td>python</td>
<td>版本推荐 3.10.12</td>
</tr>
<tr>
<td>transformers</td>
<td>版本推荐 4.30.2</td>
</tr>
<tr>
<td>torch</td>
<td>推荐使用 2.0 及以上的版本</td>
</tr>
</tbody></table>
<p>Conda安装：<br><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/0_uekyJo3D19QagAxx.png" alt="img"><br>    Conda是一个开源的软件包管理系统和环境管理系统，主要用于在Linux、Windows和macOS上管理Python包和它们的依赖项。它像一个虚拟环境，可以让用户在不同环境中安装和使用不同的软件包，而无需担心版本冲突问题。Conda适用于Python的多个版本，并附带大量常用的数据科学包。</p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line">wget -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh</span><br><span class="line">bash Miniconda3-latest-Linux-x86_64.sh</span><br><span class="line">echo -e &quot;export PATH=/root/miniconda3/bin:\$PATH\n“ &gt;&gt; ~/.bashrc</span><br><span class="line">conda -V</span><br></pre></td></tr></table></figure>


<p>Cuda安装：</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1_Z_vXwV0SPudOAdlZnoAkWA.png" alt="Introduction to CUDA. GPU programming using CUDA. | by Umangshrestha | Geek  Culture | Medium"></p>
<pre><code>    CUDA（Compute Unified Device Architecture）是由NVIDIA公司开发的一个并行计算平台和编程模型。它允许开发者使用NVIDIA的GPU（图形处理器）进行高性能计算。
    CUDA提供了一系列的API和工具，使得开发者可以用C、C++和Fortran等编程语言来编写代码，这些代码可以在GPU上并行执行，从而加速计算密集型任务，比如科学计算、数据分析、机器学习和深度学习等。
</code></pre>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br></pre></td><td class="code"><pre><span class="line">wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin</span><br><span class="line">sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600</span><br><span class="line">wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda-repo-ubuntu2204-11-8-local_11.8.0-520.61.05-1_amd64.deb</span><br><span class="line">sudo dpkg -i cuda-repo-ubuntu2204-11-8-local_11.8.0-520.61.05-1_amd64.deb</span><br><span class="line">sudo cp /var/cuda-repo-ubuntu2204-11-8-local/cuda-*-keyring.gpg /usr/share/keyrings/</span><br><span class="line">sudo apt-get update</span><br><span class="line">sudo apt-get -y install cuda</span><br><span class="line"></span><br><span class="line">nvidia-smi</span><br><span class="line">lsb_release -a</span><br></pre></td></tr></table></figure>


<p>设置环境变量：</p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line">echo -e &quot;export PATH=/usr/local/cuda/bin:\$PATH\n\</span><br><span class="line">export LD_LIBRARY_PATH=\$LD_LIBRARY_PATH:/usr/local/cuda/lib64\n\</span><br><span class="line">export LIBRARY_PATH=\$LIBRARY_PATH:/usr/local/cuda/lib64&quot; &gt;&gt; ~/.bashrc</span><br><span class="line">source ~/.bashrc</span><br></pre></td></tr></table></figure>


<p>安装Cudnn:</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/download.png" alt="img"></p>
<p>CUDA Deep Neural Network（cuDNN）是NVIDIA公司开发的一个开源库，专为深度神经网络设计，可以在NVIDIA的GPU上提供高性能的数值计算能力。cuDNN优化了深度学习算法中的卷积神经网络（CNN）和多层感知器（MLP）等操作的执行速度，使得神经网络模型的训练和推理能够在GPU上高效运行。</p>
<p>cudnn下载地址：<a target="_blank" rel="noopener" href="https://developer.nvidia.com/rdp/cudnn-archive">https://developer.nvidia.com/rdp/cudnn-archive</a></p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line">uname -m &amp;&amp; cat /etc/*release</span><br><span class="line">dpkg -i cudnn-local-repo-ubuntu2204-8.9.6.50_1.0-1_amd64.deb</span><br><span class="line">sudo cp /var/cudnn-local-repo-ubuntu2204-8.9.6.50/cudnn-local-692B6C75-keyring.gpg /usr/share/keyrings/</span><br><span class="line">sudo apt update</span><br><span class="line">sudo apt install libcudnn8</span><br><span class="line">sudo apt install libcudnn8-dev</span><br><span class="line">sudo apt install libcudnn8-samples</span><br></pre></td></tr></table></figure>


<p>验证安装：</p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line">sudo apt-get install g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev -y</span><br><span class="line">sudo apt-get install libfreeimage3 libfreeimage-dev -y</span><br><span class="line"></span><br><span class="line">cp -r /usr/src/cudnn_samples_v8/ $HOME</span><br><span class="line">cd  $HOME/cudnn_samples_v8/mnistCUDNN</span><br><span class="line">make clean &amp;&amp; make</span><br><span class="line">./mnistCUDNN</span><br></pre></td></tr></table></figure>


<p>创建Python虚拟环境：</p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">conda create --name ChatGLM3env python=3.10.12</span><br><span class="line">conda activate ChatGLM3env</span><br></pre></td></tr></table></figure>


<p>在Python虚拟环境中安装依赖：</p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia -y</span><br></pre></td></tr></table></figure>


<p>在&#x2F;root目录，克隆ChatGLM3：</p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line">apt install git-lfs</span><br><span class="line">git clone https://github.com/THUDM/ChatGLM3.git</span><br><span class="line">cd ChatGLM3/</span><br><span class="line">pip install -r requirements.txt</span><br></pre></td></tr></table></figure>


<p>在&#x2F;root目录，克隆模型：</p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br></pre></td><td class="code"><pre><span class="line">apt install git-lfs</span><br><span class="line">git lfs install</span><br><span class="line">git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git</span><br><span class="line"></span><br><span class="line">pip install transformers</span><br><span class="line">pip install accelerate</span><br><span class="line">pip install chardet</span><br><span class="line">echo -e &quot;export MODEL_PATH=/root/chatglm3-6b\n&quot; &gt;&gt;  ~/.bashrc</span><br><span class="line">source ~/.bashrc</span><br><span class="line">conda activate ChatGLM3env</span><br></pre></td></tr></table></figure>


<p><strong>启动方式一</strong>：命令行模式</p>
<figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">cd /root/ChatGLM3/basic_demo</span><br><span class="line">python cli_demo.py</span><br></pre></td></tr></table></figure>


<p><strong>启动方式二</strong>：<span style='color: red'><strong>免开防火墙</strong></span></p>
<p>开放Gradio外部链接：</p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br></pre></td><td class="code"><pre><span class="line">wget -c https://cdn-media.huggingface.co/frpc-gradio-0.2/frpc_linux_amd64</span><br><span class="line">mv ./frpc_linux_amd64 /root/miniconda3/envs/ChatGLM3env/lib/python3.10/site-packages/gradio/frpc_linux_amd64_v0.2</span><br><span class="line">chmod +x /root/miniconda3/envs/ChatGLM3env/lib/python3.10/site-packages/gradio/frpc_linux_amd64_v0.2</span><br></pre></td></tr></table></figure>

<p>若要开放外部访问端口，需要编辑web_demo_gradio.py文件的最底部，修改share参数为True：</p>
<figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">vim web_demo_gradio.py</span><br><span class="line">demo.launch(server_name=&quot;127.0.0.1&quot;, server_port=8501, inbrowser=True, share=True)</span><br></pre></td></tr></table></figure>

<p>启动：</p>
<figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br></pre></td><td class="code"><pre><span class="line">cd /root/ChatGLM3/basic_demo</span><br><span class="line">conda activate ChatGLM3env</span><br><span class="line">python web_demo_gradio.py</span><br></pre></td></tr></table></figure>


<p><strong>启动方式三</strong>：<strong>需要开放阿里云安全组8501端口</strong></p>
<figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br></pre></td><td class="code"><pre><span class="line">cd /root/ChatGLM3/basic_demo</span><br><span class="line">conda activate ChatGLM3env</span><br><span class="line">streamlit run web_demo_streamlit.py</span><br></pre></td></tr></table></figure>


<p>中文词嵌入模型：</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>BAAI General Embedding是北京智源人工智能研究院开源的一系列embedding大模型，支持中文和英文的embedding。效果很好，重要的是免费商用授权！</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>BAAI General Embedding - large - zh是其中文版本，输入序列512，输出维度1024</p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">git clone https://www.modelscope.cn/AI-ModelScope/bge-large-zh.git</span><br><span class="line">export EMBEDDING_PATH=/root/bge-large-zh	</span><br></pre></td></tr></table></figure>


<h3 id="3-2-ChatGLM3-6B体验演示"><a href="#3-2-ChatGLM3-6B体验演示" class="headerlink" title="3.2 ChatGLM3-6B体验演示"></a>3.2 ChatGLM3-6B体验演示</h3><p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704708127307.png" alt="1704708127307"></p>
<h3 id="3-3-ChatGLM3-6B接口调用演示"><a href="#3-3-ChatGLM3-6B接口调用演示" class="headerlink" title="3.3 ChatGLM3-6B接口调用演示"></a>3.3 ChatGLM3-6B接口调用演示</h3><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> langchain.chains <span class="keyword">import</span> LLMChain</span><br><span class="line"><span class="keyword">from</span> langchain.prompts <span class="keyword">import</span> PromptTemplate</span><br><span class="line"><span class="keyword">from</span> langchain.chat_models <span class="keyword">import</span> ChatOpenAI</span><br><span class="line"><span class="keyword">import</span> os</span><br><span class="line"></span><br><span class="line">template = <span class="string">&quot;&quot;&quot;&#123;question&#125;&quot;&quot;&quot;</span></span><br><span class="line">prompt = PromptTemplate(template=template, input_variables=[<span class="string">&quot;question&quot;</span>])</span><br><span class="line"></span><br><span class="line"><span class="comment"># default endpoint_url for a local deployed ChatGLM api server</span></span><br><span class="line">openai_api_base=<span class="string">&quot;http://127.0.0.1:8000/v1&quot;</span></span><br><span class="line"></span><br><span class="line"></span><br><span class="line">llm = ChatOpenAI(model=<span class="string">&quot;chatglm3-6b&quot;</span>, openai_api_base=openai_api_base, openai_api_key=<span class="string">&quot;tttttt&quot;</span>)</span><br><span class="line"></span><br><span class="line">llm_chain = LLMChain(prompt=prompt, llm=llm)</span><br><span class="line"></span><br><span class="line">question = <span class="string">&quot;好玩吗？？&quot;</span></span><br><span class="line"></span><br><span class="line"><span class="built_in">print</span>(llm_chain.run(question))</span><br></pre></td></tr></table></figure>


<h2 id="第四章-向量数据库ChromaDB介绍"><a href="#第四章-向量数据库ChromaDB介绍" class="headerlink" title="第四章 向量数据库ChromaDB介绍"></a>第四章 向量数据库ChromaDB介绍</h2><h3 id="4-1-ChromaDB安装"><a href="#4-1-ChromaDB安装" class="headerlink" title="4.1 ChromaDB安装"></a>4.1 ChromaDB安装</h3><p>在本教程中，我们将使用 ChromaDB 的客户端版本。客户端版本是内存数据库，这意味着它不需要像基于服务器的数据库那样进行任何额外的设置或配置。它非常适合学习和测试目的，因为它允许您快速轻松地试验 ChromaDB 的功能。但是，请记住，由于它位于内存中，因此当 Python 脚本完成运行时，存储在客户端中的数据将会丢失。</p>
<p>安装向量数据库</p>
<figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">pip install chromadb</span><br></pre></td></tr></table></figure>


<figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 测试服务是否启动</span></span><br><span class="line"><span class="built_in">print</span>(client.heartbeat())</span><br></pre></td></tr></table></figure>


<h3 id="4-2-函数介绍"><a href="#4-2-函数介绍" class="headerlink" title="4.2 函数介绍"></a>4.2 函数介绍</h3><h4 id="4-2-1-客户端类型"><a href="#4-2-1-客户端类型" class="headerlink" title="4.2.1 客户端类型"></a>4.2.1 客户端类型</h4><p>ChromaDB提供了不同的客户端类型以适应不同的使用场景。</p>
<table>
<thead>
<tr>
<th>客户端类型</th>
<th>描述</th>
<th>用途</th>
</tr>
</thead>
<tbody><tr>
<td>EphemeralClient</td>
<td>临时客户端，会话结束后自动断开连接。</td>
<td>用于不需要持久连接的场景，例如简单的数据插入或查询。</td>
</tr>
<tr>
<td>PersistentClient</td>
<td>持久客户端，保持连接状态直到显式断开。</td>
<td>用于需要长时间运行的应用程序，可以复用连接以提高效率。</td>
</tr>
<tr>
<td>HttpClient</td>
<td>HTTP 客户端，通过 HTTP 协议与 ChromaDB 通信。</td>
<td>用于可以通过 HTTP 请求访问 ChromaDB 的场景。</td>
</tr>
<tr>
<td>Client</td>
<td>通用的客户端接口，可以是 EphemeralClient 或 PersistentClient。</td>
<td>用于不关心客户端类型的场景，可以根据需要自动选择合适的客户端。</td>
</tr>
</tbody></table>
<h4 id="4-2-2-客户端方法"><a href="#4-2-2-客户端方法" class="headerlink" title="4.2.2 客户端方法"></a>4.2.2 客户端方法</h4><table>
<thead>
<tr>
<th>函数</th>
<th>功能</th>
<th>用途</th>
</tr>
</thead>
<tbody><tr>
<td>heartbeat</td>
<td>发送心跳包以保持连接活跃。</td>
<td>用于保持客户端与 ChromaDB 的连接活跃。</td>
</tr>
<tr>
<td>list_collections</td>
<td>列出所有向量集合。</td>
<td>用于获取数据库中所有向量集合的列表。</td>
</tr>
<tr>
<td>create_collection</td>
<td>创建一个新的向量集合。</td>
<td>用于创建新的向量集合以存储向量数据。</td>
</tr>
<tr>
<td>get_collection</td>
<td>获取指定向量集合的详细信息。</td>
<td>用于获取特定向量集合的信息。</td>
</tr>
<tr>
<td>get_or_create_collection</td>
<td>获取指定向量集合，如果不存在则创建它。</td>
<td>用于确保向量集合存在，并返回它的引用。</td>
</tr>
<tr>
<td>delete_collection</td>
<td>删除指定的向量集合。</td>
<td>用于删除不再需要的向量集合。</td>
</tr>
<tr>
<td>reset</td>
<td>重置客户端状态。</td>
<td>用于重置客户端的状态，例如清除缓存。</td>
</tr>
<tr>
<td>get_version</td>
<td>获取 ChromaDB 的版本信息。</td>
<td>用于获取当前运行的 ChromaDB 版本。</td>
</tr>
<tr>
<td>get_settings</td>
<td>获取 ChromaDB 的设置信息。</td>
<td>用于获取 ChromaDB 的配置设置。</td>
</tr>
</tbody></table>
<h4 id="4-2-3-集成对象"><a href="#4-2-3-集成对象" class="headerlink" title="4.2.3 集成对象"></a>4.2.3 集成对象</h4><table>
<thead>
<tr>
<th>函数</th>
<th>功能</th>
<th>用途</th>
</tr>
</thead>
<tbody><tr>
<td>count</td>
<td>返回指定向量集合中向量的数量。</td>
<td>用于统计向量集合中元素的数量。</td>
</tr>
<tr>
<td>add</td>
<td>向指定向量集合中添加一个或多个向量。</td>
<td>用于向集合中添加新的向量数据。</td>
</tr>
<tr>
<td>get</td>
<td>获取指定向量的值。</td>
<td>用于获取一个向量对应的值。</td>
</tr>
<tr>
<td>peek</td>
<td>查看指定向量的值，但不改变其缓存状态。</td>
<td>用于查看向量的值，但不影响该值在数据库中的缓存时效。</td>
</tr>
<tr>
<td>query</td>
<td>执行一个查询，返回满足条件的向量及其对应的值。</td>
<td>用于在向量集合中查询满足特定条件的向量。</td>
</tr>
<tr>
<td>modify</td>
<td>修改指定向量的值。</td>
<td>用于修改一个已经存在的向量的值。</td>
</tr>
<tr>
<td>update</td>
<td>更新指定向量的值，如果向量不存在，则创建向量。</td>
<td>用于更新一个向量的值，如果向量不存在，则创建新的向量。</td>
</tr>
<tr>
<td>upsert</td>
<td>更新指定向量的值，如果向量不存在，则创建向量。</td>
<td>用于更新一个向量的值，如果向量不存在，则创建新的向量。</td>
</tr>
<tr>
<td>delete</td>
<td>删除指定向量。</td>
<td>用于删除一个向量以及其对应的值。</td>
</tr>
</tbody></table>
<h3 id="4-3-集合的增删改查"><a href="#4-3-集合的增删改查" class="headerlink" title="4.3 集合的增删改查"></a>4.3 集合的增删改查</h3><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">neo_collection = client.create_collection(name=<span class="string">&quot;neo&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 检测集合</span></span><br><span class="line"><span class="built_in">print</span>(neo_collection)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 修改集合</span></span><br><span class="line">neo_collection.modify(name=<span class="string">&quot;liudehua&quot;</span>)</span><br><span class="line"><span class="built_in">print</span>(neo_collection)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 统计集合中的数量</span></span><br><span class="line">item_count = neo_collection.count() </span><br><span class="line"><span class="built_in">print</span>(<span class="string">f&quot;集合项目合计: <span class="subst">&#123;item_count&#125;</span>&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 获取或创建集合并更改距离函数</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line"><span class="string">在 ChromaDB 中，距离函数确定如何计算集合中两个项目之间的“距离”或“差异”。这在执行查询类似项目等操作时至关重要。</span></span><br><span class="line"><span class="string">ChromaDB 中默认的距离函数是&quot;l2&quot;，代表欧氏距离。这是飞机上距离的常见测量方法。</span></span><br><span class="line"><span class="string">但是，有时其他距离度量可能更合适，具体取决于集合中数据的性质。</span></span><br><span class="line"><span class="string">请记住，距离函数的选择可以显着影响查询结果，因此请明智选择！</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line">trinity_collection = client.get_or_create_collection( </span><br><span class="line">    name=<span class="string">&quot;trinity&quot;</span>, metadata=&#123;<span class="string">&quot;hnsw:space&quot;</span>: <span class="string">&quot;cosine&quot;</span>&#125;</span><br><span class="line">)</span><br><span class="line"><span class="built_in">print</span>(trinity_collection)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 删除集合</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line"><span class="string">注意，如果集合不存在，delete_collection则会引发错误。</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line"><span class="keyword">try</span>: </span><br><span class="line">    client.delete_collection(name=<span class="string">&quot;liudehua&quot;</span>) </span><br><span class="line">    <span class="built_in">print</span>(<span class="string">&quot;liudehua 集合已经删除.&quot;</span>) </span><br><span class="line"><span class="keyword">except</span> ValueError <span class="keyword">as</span> e: </span><br><span class="line">    <span class="built_in">print</span>(<span class="string">f&quot;错误: <span class="subst">&#123;e&#125;</span>&quot;</span>) </span><br></pre></td></tr></table></figure>


<h3 id="4-4-添加文档到ChromaDB"><a href="#4-4-添加文档到ChromaDB" class="headerlink" title="4.4 添加文档到ChromaDB"></a>4.4 添加文档到ChromaDB</h3><h4 id="4-4-1-添加原始文档"><a href="#4-4-1-添加原始文档" class="headerlink" title="4.4.1 添加原始文档"></a>4.4.1 添加原始文档</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">neo_collection = client.create_collection(name=<span class="string">&quot;neo&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生文档</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line"><span class="string">当传递给add方法句子尚未未进行嵌入时候，ChromaDB会自动为我们嵌入这些文档。</span></span><br><span class="line"><span class="string">默认情况下，如果在集合创建过程中未提供特定的嵌入函数，ChromaDB将使用句子转换器进行嵌入。</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line">neo_collection.add(</span><br><span class="line">    documents=[<span class="string">&quot;I Love chinese.&quot;</span>, <span class="string">&quot;There is good space.&quot;</span>], ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>]</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 统计集合中的项目数量</span></span><br><span class="line">item_count = neo_collection.count()</span><br><span class="line"><span class="built_in">print</span>(<span class="string">f&quot;集合项目合计: <span class="subst">&#123;item_count&#125;</span>&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 从集合中获取项目</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;默认情况下，这将返回一个字典，其中包含集合中项目的 ID、元数据（如果包含）和文档。&#x27;&#x27;&#x27;</span></span><br><span class="line">items = neo_collection.get()</span><br><span class="line"><span class="built_in">print</span>(items)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 使用Peek方法获取指定数量的项目</span></span><br><span class="line">neo_collection.peek(limit=<span class="number">5</span>)</span><br></pre></td></tr></table></figure>

<h4 id="4-4-2-添加文档关联"><a href="#4-4-2-添加文档关联" class="headerlink" title="4.4.2 添加文档关联"></a>4.4.2 添加文档关联</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">collection = client.create_collection(name=<span class="string">&quot;morpheus&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加文档关联的嵌入</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;下方代码添加了个文档到ChromaDB，而且每个文档都与唯一的 ID 和嵌入相关联。&#x27;&#x27;&#x27;</span></span><br><span class="line">collection.add(</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;What if I told you everything you knew was a lie.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;Welcome to the real world.&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">    embeddings=[[<span class="number">0.1</span>, <span class="number">0.2</span>, <span class="number">0.3</span>], [<span class="number">0.4</span>, <span class="number">0.5</span>, <span class="number">0.6</span>]],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 统计集合中的项目数量</span></span><br><span class="line">item_count = collection.count()</span><br><span class="line"><span class="built_in">print</span>(<span class="string">f&quot;集合项目合计: <span class="subst">&#123;item_count&#125;</span>&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 从集合中获取项目</span></span><br><span class="line">items = collection.get()</span><br><span class="line"><span class="built_in">print</span>(items)</span><br></pre></td></tr></table></figure>


<h4 id="4-4-3-添加嵌入和元数据"><a href="#4-4-3-添加嵌入和元数据" class="headerlink" title="4.4.3 添加嵌入和元数据"></a>4.4.3 添加嵌入和元数据</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">locations_collection = client.create_collection(name=<span class="string">&quot;locations&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加嵌入和元数据</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line"><span class="string">仅添加元数据而不添加任何文档在多种情况下可能很有用：</span></span><br><span class="line"><span class="string">	1、外部文档存储：由于其大小或安全原因，实际文档可能存储在外部系统中。在这种情况下，元数据可以包括对外部系统中的实际文档的引用或链接。</span></span><br><span class="line"><span class="string">	2、隐私问题：在某些情况下，由于隐私问题或法规，实际文件无法存储。然而，不包含敏感信息的元数据可以被存储并用于分析。</span></span><br><span class="line"><span class="string">	3、效率：存储和检索元数据比处理大型文档更有效，特别是当执行分析或操作不需要这些文档时。</span></span><br><span class="line"><span class="string">	4、预处理数据：在某些情况下，文档可能已被预处理为更有用的形式（例如嵌入），并且不再需要原始文档。元数据可以为预处理数据提供额外的上下文。</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line">locations_collection.add(</span><br><span class="line">    embeddings=[[<span class="number">0.1</span>, <span class="number">0.2</span>, <span class="number">0.3</span>], [<span class="number">0.4</span>, <span class="number">0.5</span>, <span class="number">0.6</span>]],</span><br><span class="line">    metadatas=[</span><br><span class="line">        &#123;<span class="string">&quot;location&quot;</span>: <span class="string">&quot;Zion&quot;</span>, <span class="string">&quot;description&quot;</span>: <span class="string">&quot;Last human city&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;location&quot;</span>: <span class="string">&quot;Machine City&quot;</span>, <span class="string">&quot;description&quot;</span>: <span class="string">&quot;City inhabited by machines&quot;</span>&#125;,</span><br><span class="line">    ],</span><br><span class="line">    ids=[<span class="string">&quot;loc_1&quot;</span>, <span class="string">&quot;loc_2&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 统计集合中的项目数量</span></span><br><span class="line">item_count = locations_collection.count()</span><br><span class="line"><span class="built_in">print</span>(<span class="string">f&quot;集合项目合计: <span class="subst">&#123;item_count&#125;</span>&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 从集合中获取项目</span></span><br><span class="line">items = locations_collection.get()</span><br><span class="line"><span class="built_in">print</span>(items)</span><br></pre></td></tr></table></figure>


<h3 id="4-5-查询集合"><a href="#4-5-查询集合" class="headerlink" title="4.5 查询集合"></a>4.5 查询集合</h3><h4 id="4-5-1-查询嵌入"><a href="#4-5-1-查询嵌入" class="headerlink" title="4.5.1 查询嵌入"></a>4.5.1 查询嵌入</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">neo_collection = client.create_collection(name=<span class="string">&quot;neo&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加嵌入和元数据</span></span><br><span class="line">neo_collection.add(</span><br><span class="line">    embeddings=[[<span class="number">0.1</span>, <span class="number">0.2</span>, <span class="number">0.3</span>], [<span class="number">0.4</span>, <span class="number">0.5</span>, <span class="number">0.6</span>]],</span><br><span class="line">    metadatas=[&#123;<span class="string">&quot;quote&quot;</span>: <span class="string">&quot;I know kung fu.&quot;</span>&#125;, &#123;<span class="string">&quot;quote&quot;</span>: <span class="string">&quot;There is no spoon.&quot;</span>&#125;],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>]</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 通过一个集合查询嵌入</span></span><br><span class="line">results = neo_collection.query(</span><br><span class="line">    query_embeddings=[[<span class="number">0.1</span>, <span class="number">0.2</span>, <span class="number">0.3</span>]],</span><br><span class="line">    n_results=<span class="number">1</span></span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 返回与每个查询嵌入最接近的匹配项。记住，距离 越近0，查询嵌入与集合中的嵌入越相似。</span></span><br><span class="line"><span class="built_in">print</span>(results)</span><br></pre></td></tr></table></figure>


<h4 id="4-5-2-查询文本"><a href="#4-5-2-查询文本" class="headerlink" title="4.5.2 查询文本"></a>4.5.2 查询文本</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">morpheus_collection = client.create_collection(</span><br><span class="line">    name=<span class="string">&quot;morpheus&quot;</span>, metadata=&#123;<span class="string">&quot;hnsw:space&quot;</span>: <span class="string">&quot;cosine&quot;</span>&#125;</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生文档</span></span><br><span class="line">morpheus_collection.add(</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;This is your last chance. After this, there is no turning back.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You take the blue pill, the story ends, you wake up in your bed and believe whatever you want to believe.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You take the red pill, you stay in Wonderland, and I show you how deep the rabbit hole goes.&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_3&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 查询：我们查询包含文本“服用红色药丸”的集合。我们指定要检索 2 个结果 ( n_results=2)</span></span><br><span class="line">results = morpheus_collection.query(</span><br><span class="line">    query_texts=[<span class="string">&quot;Take the red pill&quot;</span>],</span><br><span class="line">    n_results=<span class="number">2</span>,</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 结果将包括 ID、元数据（如果提供）和最接近匹配的文档。结果的顺序基于其与查询文本的相似性，最相似的结果首先出现。</span></span><br><span class="line"><span class="built_in">print</span>(results)</span><br></pre></td></tr></table></figure>


<h4 id="4-5-3-通过ID检索"><a href="#4-5-3-通过ID检索" class="headerlink" title="4.5.3 通过ID检索"></a>4.5.3 通过ID检索</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">trinity_collection = client.get_or_create_collection(name=<span class="string">&quot;trinity&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生文档</span></span><br><span class="line">trinity_collection.add(</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;Dodge this.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;I think they&#x27;re trying to tell us something.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;Neo, no one has ever done this before.&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_3&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 通过id检索内容</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line"><span class="string">什么时候需要通过ID检索内容？</span></span><br><span class="line"><span class="string">	1、特定文档检索：如果您有要检索的特定文档的 ID，则可以使用该get方法从集合中获取这些文档。</span></span><br><span class="line"><span class="string">	2、数据验证：您可以使用该get方法来验证特定项目的存在性并根据其 ID 检索特定项目，从而确保数据的完整性。</span></span><br><span class="line"><span class="string">	3、选择性分析：通过从集合中检索特定项目，您可以对这些特定文档进行有针对性的分析或操作。</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line">items = trinity_collection.get(ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_3&quot;</span>])</span><br><span class="line"></span><br><span class="line"><span class="built_in">print</span>(items)</span><br></pre></td></tr></table></figure>


<h4 id="4-5-4-通过文本检索数据"><a href="#4-5-4-通过文本检索数据" class="headerlink" title="4.5.4 通过文本检索数据"></a>4.5.4 通过文本检索数据</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">morpheus_collection = client.get_or_create_collection(name=<span class="string">&quot;morpheus&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生文档</span></span><br><span class="line">morpheus_collection.add(</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;This is your last chance. After this, there is no turning back.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You take the blue pill, the story ends, you wake up in your bed and believe whatever you want to believe.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You take the red pill, you stay in Wonderland, and I show you how deep the rabbit hole goes.&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_3&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 通过文本查询集合并选择返回哪些数据</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line"><span class="string">什么时候通过文本检索数据？</span></span><br><span class="line"><span class="string">	1、选择性数据检索：通过在参数中指定所需的数据include，您可以仅检索必要的信息，从而减少网络流量并提高性能。</span></span><br><span class="line"><span class="string">	2、数据隐私和安全：您可以排除返回敏感信息，确保仅公开必要的非敏感数据。</span></span><br><span class="line"><span class="string">	3、效率和资源优化：通过选择特定数据，您可以优化资源使用并提高应用程序的效率。</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line">results = morpheus_collection.query(</span><br><span class="line">    query_texts=[<span class="string">&quot;take the red pill&quot;</span>], n_results=<span class="number">1</span>, include=[<span class="string">&quot;distances&quot;</span>, <span class="string">&quot;embeddings&quot;</span>]</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="built_in">print</span>(results)</span><br></pre></td></tr></table></figure>


<h4 id="4-5-5-通过查询条件检索数据"><a href="#4-5-5-通过查询条件检索数据" class="headerlink" title="4.5.5 通过查询条件检索数据"></a>4.5.5 通过查询条件检索数据</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">matrix_collection = client.create_collection(name=<span class="string">&quot;matrix&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生文档</span></span><br><span class="line">matrix_collection.add(</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;The Matrix is everywhere, it is all around us.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You can see it when you look out your window or when you turn on your television.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;Unfortunately, no one can be told what the Matrix is&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You hear that Mr. Anderson?... That is the sound of inevitability...&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You are a plague, Mr. Anderson. You and your kind are a cancer of this planet.&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">    metadatas=[</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Agent Smith&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Agent Smith&quot;</span>&#125;,</span><br><span class="line">    ],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_3&quot;</span>, <span class="string">&quot;quote_4&quot;</span>, <span class="string">&quot;quote_5&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 通过文本查询集合并选择返回哪些数据</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line"><span class="string">什么时候通过查询条件检索数据？</span></span><br><span class="line"><span class="string">	1、基于元数据的过滤：您可以根据特定的元数据字段（例如演讲者、类别或任何其他相关条件）过滤项目。</span></span><br><span class="line"><span class="string">	2、定向分析：通过使用where过滤器过滤结果，您可以对满足特定元数据条件的特定数据子集进行定向分析或操作。</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line">results = matrix_collection.query(</span><br><span class="line">    query_texts=[<span class="string">&quot;What is the Matrix?&quot;</span>],</span><br><span class="line">    where=&#123;<span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">    n_results=<span class="number">2</span>,</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="built_in">print</span>(results)</span><br></pre></td></tr></table></figure>


<h3 id="4-6-更新集合中的数据"><a href="#4-6-更新集合中的数据" class="headerlink" title="4.6 更新集合中的数据"></a>4.6 更新集合中的数据</h3><h4 id="4-6-1-更新属性"><a href="#4-6-1-更新属性" class="headerlink" title="4.6.1 更新属性"></a>4.6.1 更新属性</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">matrix_collection = client.create_collection(name=<span class="string">&quot;matrix&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生文档</span></span><br><span class="line">matrix_collection.add(</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;The Matrix is everywhere, it is all around us.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You can see it when you look out your window or when you turn on your television.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You can feel it when you go to work, when you go to church, when you pay your taxes.&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">    metadatas=[</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">    ],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_3&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 更新集合中想项目</span></span><br><span class="line">matrix_collection.update(</span><br><span class="line">    ids=[<span class="string">&quot;quote_2&quot;</span>],</span><br><span class="line">    metadatas=[&#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;],</span><br><span class="line">    documents=[<span class="string">&quot;The Matrix is a system, Neo. That system is our enemy.&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 查询更新后的值</span></span><br><span class="line">items = matrix_collection.get(ids=[<span class="string">&quot;quote_2&quot;</span>])</span><br><span class="line"></span><br><span class="line"><span class="built_in">print</span>(items)</span><br></pre></td></tr></table></figure>


<h4 id="4-6-2-更新插入操作"><a href="#4-6-2-更新插入操作" class="headerlink" title="4.6.2 更新插入操作"></a>4.6.2 更新插入操作</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br><span class="line">43</span><br><span class="line">44</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">matrix_collection = client.get_or_create_collection(name=<span class="string">&quot;matrix&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生文档</span></span><br><span class="line">matrix_collection.add(</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;The Matrix is everywhere, it is all around us.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You can see it when you look out your window or when you turn on your television.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You can feel it when you go to work, when you go to church, when you pay your taxes.&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">    metadatas=[</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">    ],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_3&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 更新插入操作</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line"><span class="string">该upsert方法获取要更新或添加的项目的 ID、嵌入、元数据和文档。</span></span><br><span class="line"><span class="string">如果集合中已经存在某个 ID，则相应的项目将被更新。如果 ID 不存在，则会添加新项目。</span></span><br><span class="line"><span class="string">&#x27;&#x27;&#x27;</span></span><br><span class="line">matrix_collection.upsert(</span><br><span class="line">    ids=[<span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_4&quot;</span>],</span><br><span class="line">    metadatas=[</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Agent Smith&quot;</span>&#125;,</span><br><span class="line">    ],</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;You take the blue pill, the story ends, you wake up in your bed and believe whatever you want to believe.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;I&#x27;m going to enjoy watching you die, Mr. Anderson.&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 查询更新后的值</span></span><br><span class="line">items = matrix_collection.get(ids=[<span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_4&quot;</span>])</span><br><span class="line"></span><br><span class="line"><span class="built_in">print</span>(items)</span><br></pre></td></tr></table></figure>


<h3 id="4-7-删除集合中的数据"><a href="#4-7-删除集合中的数据" class="headerlink" title="4.7 删除集合中的数据"></a>4.7 删除集合中的数据</h3><h4 id="4-7-1-按ID删除"><a href="#4-7-1-按ID删除" class="headerlink" title="4.7.1 按ID删除"></a>4.7.1 按ID删除</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">trinity_collection = client.create_collection(name=<span class="string">&quot;trinity&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生文档</span></span><br><span class="line">trinity_collection.add(</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;I know why you&#x27;re here, Neo.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;The answer is out there, Neo. It&#x27;s looking for you. And it will find you if you want it to.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;Neo, no one has ever done this before.&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_3&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 通过id删除集合中的项</span></span><br><span class="line">trinity_collection.delete(ids=[<span class="string">&quot;quote_3&quot;</span>])</span><br><span class="line"></span><br><span class="line"><span class="comment"># 检索删除后的结果</span></span><br><span class="line">items = trinity_collection.get()</span><br><span class="line"></span><br><span class="line"><span class="built_in">print</span>(items)</span><br></pre></td></tr></table></figure>

<h4 id="4-7-2-按条件删除"><a href="#4-7-2-按条件删除" class="headerlink" title="4.7.2 按条件删除"></a>4.7.2 按条件删除</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">matrix_collection = client.create_collection(name=<span class="string">&quot;matrix&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生文档</span></span><br><span class="line">matrix_collection.add(</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;The Matrix is everywhere, it is all around us.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You can see it when you look out your window or when you turn on your television.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;You can feel it when you go to work, when you go to church, when you pay your taxes.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;It seems that you&#x27;ve been living two lives.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;I believe that, as a species, human beings define their reality through misery and suffering&quot;</span>,</span><br><span class="line">        <span class="string">&quot;Human beings are a disease, a cancer of this planet.&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">    metadatas=[</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Morpheus&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Agent Smith&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Agent Smith&quot;</span>&#125;,</span><br><span class="line">        &#123;<span class="string">&quot;category&quot;</span>: <span class="string">&quot;quote&quot;</span>, <span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Agent Smith&quot;</span>&#125;,</span><br><span class="line">    ],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_3&quot;</span>, <span class="string">&quot;quote_4&quot;</span>, <span class="string">&quot;quote_5&quot;</span>, <span class="string">&quot;quote_6&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 按照匹配到的条件进行删除</span></span><br><span class="line">matrix_collection.delete(where=&#123;<span class="string">&quot;speaker&quot;</span>: <span class="string">&quot;Agent Smith&quot;</span>&#125;)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 统计删除后的数量</span></span><br><span class="line">item_count = matrix_collection.count()</span><br><span class="line"><span class="built_in">print</span>(<span class="string">f&quot;删除后的数量剩余： <span class="subst">&#123;item_count&#125;</span>&quot;</span>)</span><br></pre></td></tr></table></figure>

<h3 id="4-8-使用嵌入函数"><a href="#4-8-使用嵌入函数" class="headerlink" title="4.8 使用嵌入函数"></a>4.8 使用嵌入函数</h3><h4 id="4-8-1-使用OpenAI嵌入函数"><a href="#4-8-1-使用OpenAI嵌入函数" class="headerlink" title="4.8.1 使用OpenAI嵌入函数"></a>4.8.1 使用OpenAI嵌入函数</h4><p>需要确保本机已经安装openai的python包。</p>
<figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">pip install openai</span><br></pre></td></tr></table></figure>

<figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"><span class="keyword">from</span> chromadb.utils <span class="keyword">import</span> embedding_functions</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建一个集合</span></span><br><span class="line">openai_ef = embedding_functions.OpenAIEmbeddingFunction(</span><br><span class="line">    api_key=<span class="string">&quot;USE YOUR OPEN-AI KEY&quot;</span>,</span><br><span class="line">    model_name=<span class="string">&quot;text-embedding-ada-002&quot;</span>,</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 使用OpenAI嵌入函数创建一个集合</span></span><br><span class="line">matrix_collection = client.create_collection(</span><br><span class="line">    name=<span class="string">&quot;matrix&quot;</span>,</span><br><span class="line">    embedding_function=openai_ef,</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生文档</span></span><br><span class="line">matrix_collection.add(</span><br><span class="line">    documents=[</span><br><span class="line">        <span class="string">&quot;The Matrix is all around us.&quot;</span>,</span><br><span class="line">        <span class="string">&quot;What you know you can&#x27;t explain, but you feel it&quot;</span>,</span><br><span class="line">        <span class="string">&quot;There is a difference between knowing the path and walking the path&quot;</span>,</span><br><span class="line">    ],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>, <span class="string">&quot;quote_3&quot;</span>],</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 查询文本</span></span><br><span class="line">results = matrix_collection.query(query_texts=[<span class="string">&quot;What is the Matrix?&quot;</span>], n_results=<span class="number">2</span>)</span><br><span class="line"></span><br><span class="line"><span class="built_in">print</span>(results)</span><br></pre></td></tr></table></figure>

<h4 id="4-8-2-自定义嵌入函数"><a href="#4-8-2-自定义嵌入函数" class="headerlink" title="4.8.2 自定义嵌入函数"></a>4.8.2 自定义嵌入函数</h4><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> chromadb</span><br><span class="line"><span class="keyword">from</span> chromadb.api.types <span class="keyword">import</span> Documents, EmbeddingFunction, Embeddings</span><br><span class="line"></span><br><span class="line"><span class="comment"># 自定义一个嵌入函数</span></span><br><span class="line"><span class="keyword">class</span> <span class="title class_">MyEmbeddingFunction</span>(<span class="title class_ inherited__">EmbeddingFunction</span>):</span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">__call__</span>(<span class="params">self, texts: Documents</span>) -&gt; Embeddings:</span><br><span class="line">        <span class="comment"># 为了简单起见, 我们使用文本长度作为嵌入依据。</span></span><br><span class="line">        <span class="comment"># 非正式的词嵌入函数</span></span><br><span class="line">        <span class="keyword">return</span> [[<span class="built_in">len</span>(text)] <span class="keyword">for</span> text <span class="keyword">in</span> texts]</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化客户端</span></span><br><span class="line">client = chromadb.Client()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 使用自定义嵌入函数创建一个集合</span></span><br><span class="line">neo_collection = client.create_collection(name=<span class="string">&quot;neo&quot;</span>, embedding_function=MyEmbeddingFunction())</span><br><span class="line"></span><br><span class="line"><span class="comment"># 添加原生数据</span></span><br><span class="line">neo_collection.add(</span><br><span class="line">    documents=[<span class="string">&quot;I know kung fu.&quot;</span>, <span class="string">&quot;There is no spoon.&quot;</span>],</span><br><span class="line">    ids=[<span class="string">&quot;quote_1&quot;</span>, <span class="string">&quot;quote_2&quot;</span>]</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 得到集合</span></span><br><span class="line">items = neo_collection.get(include=[<span class="string">&#x27;embeddings&#x27;</span>])</span><br><span class="line"><span class="built_in">print</span>(items)</span><br></pre></td></tr></table></figure>


<h3 id="4-9-向量数据库与langchain应用"><a href="#4-9-向量数据库与langchain应用" class="headerlink" title="4.9 向量数据库与langchain应用"></a>4.9 向量数据库与langchain应用</h3><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> langchain.text_splitter <span class="keyword">import</span> CharacterTextSplitter</span><br><span class="line"><span class="keyword">from</span> langchain_community.document_loaders <span class="keyword">import</span> TextLoader</span><br><span class="line"><span class="keyword">from</span> langchain_community.embeddings.sentence_transformer <span class="keyword">import</span> (</span><br><span class="line">    SentenceTransformerEmbeddings,</span><br><span class="line">)</span><br><span class="line"><span class="keyword">from</span> langchain_community.vectorstores <span class="keyword">import</span> Chroma</span><br><span class="line"></span><br><span class="line"><span class="comment"># 加载文档并将其分割成块</span></span><br><span class="line">loader = TextLoader(<span class="string">&quot;../../modules/state_of_the_union.txt&quot;</span>)</span><br><span class="line">documents = loader.load()</span><br><span class="line"></span><br><span class="line"><span class="comment"># 将其分成块</span></span><br><span class="line">text_splitter = CharacterTextSplitter(chunk_size=<span class="number">1000</span>, chunk_overlap=<span class="number">0</span>)</span><br><span class="line">docs = text_splitter.split_documents(documents)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 创建开源嵌入函数</span></span><br><span class="line">embedding_function = SentenceTransformerEmbeddings(model_name=<span class="string">&quot;all-MiniLM-L6-v2&quot;</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 将其加载到Chroma</span></span><br><span class="line">db = Chroma.from_documents(docs, embedding_function)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 查询</span></span><br><span class="line">query = <span class="string">&quot;What did the president say about Ketanji Brown Jackson&quot;</span></span><br><span class="line">docs = db.similarity_search(query)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 打印结果</span></span><br><span class="line"><span class="built_in">print</span>(docs[<span class="number">0</span>].page_content)</span><br></pre></td></tr></table></figure>


<h2 id="第五章-大语言模型微调-LangChain"><a href="#第五章-大语言模型微调-LangChain" class="headerlink" title="第五章 大语言模型微调 - LangChain"></a>第五章 大语言模型微调 - LangChain</h2><h3 id="5-1-LangChain原理"><a href="#5-1-LangChain原理" class="headerlink" title="5.1 LangChain原理"></a>5.1 LangChain原理</h3><h4 id="5-1-1-微调的目的"><a href="#5-1-1-微调的目的" class="headerlink" title="5.1.1 微调的目的"></a>5.1.1 微调的目的</h4><ul>
<li>学习更统一的回复，学习关注的信息，让模型更善于交谈</li>
<li>获取新知识，增加对新的概念以及了解，更正旧的不正确信息</li>
<li>二者兼备</li>
</ul>
<h4 id="5-1-2-微调常见任务"><a href="#5-1-2-微调常见任务" class="headerlink" title="5.1.2 微调常见任务"></a>5.1.2 微调常见任务</h4><p><strong>1、更多的输入，更简洁的答案</strong></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>例如：阅读、提取关键词、主题、摘要等等</p>
<p><strong>2、更少的输入，更多的输入</strong></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>例如：写作、聊天、解决问题、写代码等等</p>
<p><strong>3、判断好坏</strong></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>例如：针对电影评论的判别、针对美食的判别。给出具体答案。</p>
<h4 id="5-1-3-微调前的数据要求"><a href="#5-1-3-微调前的数据要求" class="headerlink" title="5.1.3 微调前的数据要求"></a>5.1.3 微调前的数据要求</h4><p>数据是决定微调效果的重点。</p>
<table>
<thead>
<tr>
<th>要求</th>
<th>解释</th>
</tr>
</thead>
<tbody><tr>
<td>质量要求</td>
<td>高质量数据比低质量数据更重要</td>
</tr>
<tr>
<td>数据多面性</td>
<td>多方数据比单方数据更好（即学习举一反三的能力）</td>
</tr>
<tr>
<td>数据来源</td>
<td>人工编写比机器生成更加精准</td>
</tr>
<tr>
<td>数据广泛性</td>
<td>学习更多的数据比学习更少的数据能让模型知识更广泛</td>
</tr>
</tbody></table>
<h3 id="5-2-Langchain介绍以及安装"><a href="#5-2-Langchain介绍以及安装" class="headerlink" title="5.2 Langchain介绍以及安装"></a>5.2 Langchain介绍以及安装</h3><p>LangChain是一个用于开发由语言模型支持的应用程序的框架。</p>
<p>它主要由以下几个部分组成：</p>
<ol>
<li><p>模型集成：支持多种预训练语言模型，包括用于理解和生成文本的大模型。</p>
</li>
<li><p>对话和交互：集成了对话模型，用于与用户进行交互。</p>
</li>
<li><p>文本嵌入：提供文本到向量的转换，便于进行相似性分析或检索。</p>
</li>
<li><p>提示词和模板：提供预设的提示词模板，帮助用户构建任务指令。</p>
</li>
<li><p>输出转换：允许用户自定义模型的输出格式。</p>
</li>
<li><p>索引和检索：提供文档索引和向量数据库，方便快速检索信息。</p>
</li>
<li><p>链式操作：支持将多个模型和任务串联起来，形成更复杂的处理流程。</p>
</li>
<li><p>代理和多任务：允许用户同时管理和运行多个模型或任务。</p>
</li>
</ol>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704651570992.png" alt="1704651570992"></p>
<p>PIP安装：</p>
<figure class="highlight shell"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">pip install langchain</span><br></pre></td></tr></table></figure>

<p>Conda安装：</p>
<figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">conda install langchain -c conda-forge</span><br></pre></td></tr></table></figure>

<p>LangSmith的作用是检查链或代理内部的运行情况，但LangSmith不是必需的，若要使用LangSmith则需要注册：<a target="_blank" rel="noopener" href="https://smith.langchain.com/">https://smith.langchain.com/</a></p>
<h3 id="5-3-LangChain与ChatGLM3-6B集成"><a href="#5-3-LangChain与ChatGLM3-6B集成" class="headerlink" title="5.3 LangChain与ChatGLM3-6B集成"></a>5.3 LangChain与ChatGLM3-6B集成</h3><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> langchain.chains <span class="keyword">import</span> LLMChain</span><br><span class="line"><span class="keyword">from</span> langchain.prompts <span class="keyword">import</span> PromptTemplate</span><br><span class="line"><span class="keyword">from</span> langchain.chat_models <span class="keyword">import</span> ChatOpenAI</span><br><span class="line"><span class="keyword">import</span> os</span><br><span class="line"></span><br><span class="line">template = <span class="string">&quot;&quot;&quot;&#123;question&#125;&quot;&quot;&quot;</span></span><br><span class="line">prompt = PromptTemplate(template=template, input_variables=[<span class="string">&quot;question&quot;</span>])</span><br><span class="line">openai_api_base=<span class="string">&quot;http://127.0.0.1:8000/v1&quot;</span></span><br><span class="line">llm = ChatOpenAI(model=<span class="string">&quot;chatglm3-6b&quot;</span>, openai_api_base=openai_api_base, openai_api_key=<span class="string">&quot;abcabc&quot;</span>)</span><br><span class="line">llm_chain = LLMChain(prompt=prompt, llm=llm)</span><br><span class="line"></span><br><span class="line">question = <span class="string">&quot;帮我写一篇新闻，关于美食。&quot;</span></span><br><span class="line"></span><br><span class="line"><span class="built_in">print</span>(llm_chain.run(question))</span><br></pre></td></tr></table></figure>


<h3 id="5-4-LangChain与Azure-OpenAI集成"><a href="#5-4-LangChain与Azure-OpenAI集成" class="headerlink" title="5.4 LangChain与Azure OpenAI集成"></a>5.4 LangChain与Azure OpenAI集成</h3><p>以下是LangChain与Azure OpanAI集成的代码示例</p>
<figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> os</span><br><span class="line"></span><br><span class="line">os.environ[<span class="string">&quot;OPENAI_API_TYPE&quot;</span>] = <span class="string">&quot;azure&quot;</span></span><br><span class="line">os.environ[<span class="string">&quot;OPENAI_API_VERSION&quot;</span>] = <span class="string">&quot;2023-05-15&quot;</span></span><br><span class="line">os.environ[<span class="string">&quot;OPENAI_API_BASE&quot;</span>] = <span class="string">&quot;...&quot;</span></span><br><span class="line">os.environ[<span class="string">&quot;OPENAI_API_KEY&quot;</span>] = <span class="string">&quot;...&quot;</span></span><br><span class="line"></span><br><span class="line"><span class="comment"># 导入相关的库</span></span><br><span class="line"><span class="keyword">from</span> langchain_openai <span class="keyword">import</span> AzureOpenAI</span><br><span class="line"></span><br><span class="line"><span class="comment"># 实例化一个Azure OpenAI对象</span></span><br><span class="line"><span class="comment"># 配置你需要的模型名称</span></span><br><span class="line">llm = AzureOpenAI(</span><br><span class="line">    deployment_name=<span class="string">&quot;td2&quot;</span>,</span><br><span class="line">    model_name=<span class="string">&quot;gpt-3.5-turbo-instruct&quot;</span>,</span><br><span class="line">)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 运行大语言模型</span></span><br><span class="line">llm(<span class="string">&quot;Tell me a joke&quot;</span>)</span><br></pre></td></tr></table></figure>

<p>由于Azure OpenAI的申请需要企业认证，过程较为麻烦，因此改为OpenAI对接：<a target="_blank" rel="noopener" href="https://platform.openai.com/docs/overview">https://platform.openai.com/docs/overview</a></p>
<h3 id="5-5-LangChain例子1-基础使用"><a href="#5-5-LangChain例子1-基础使用" class="headerlink" title="5.5 LangChain例子1 - 基础使用"></a>5.5 LangChain例子1 - 基础使用</h3><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> langchain.chat_models <span class="keyword">import</span> ChatOpenAI</span><br><span class="line"><span class="keyword">from</span> langchain.prompts <span class="keyword">import</span> ChatPromptTemplate</span><br><span class="line"><span class="keyword">from</span> langchain_core.output_parsers <span class="keyword">import</span> StrOutputParser</span><br><span class="line"></span><br><span class="line">prompt = ChatPromptTemplate.from_template(<span class="string">&quot;帮我写一个关于&#123;topic&#125;的简短笑话&quot;</span>)</span><br><span class="line">openai_api_base=<span class="string">&quot;http://127.0.0.1:8000/v1&quot;</span></span><br><span class="line">llm = ChatOpenAI(model=<span class="string">&quot;chatglm3-6b&quot;</span>, openai_api_base=openai_api_base, openai_api_key=<span class="string">&quot;abcabc&quot;</span>)</span><br><span class="line">output_parser = StrOutputParser()</span><br><span class="line"></span><br><span class="line">chain = prompt | llm | output_parser</span><br><span class="line">chain.invoke(&#123;<span class="string">&quot;topic&quot;</span>: <span class="string">&quot;企鹅&quot;</span>&#125;)</span><br></pre></td></tr></table></figure>

<p>过程：</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704651660722.png" alt="1704651660722"></p>
<p>输出结果：’为什么企鹅不会用电脑?因为它们的手指头太粗大,按不准键盘。’</p>
<h3 id="5-6-LangChain例子2-内存检索"><a href="#5-6-LangChain例子2-内存检索" class="headerlink" title="5.6 LangChain例子2 - 内存检索"></a>5.6 LangChain例子2 - 内存检索</h3><p>第一步：创建一个RunnableParallel具有两个条目的对象。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>第一个条目context将包括检索器获取的文档结果。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>第二个条目question将包含用户的原始问题。为了传递这个问题，我们使用 RunnablePassthrough复制此条目。</p>
<p>第二步：将上述步骤中的字典提供给prompt组件。然后，它获取用户输入question以及检索到的文档，context以构造提示并输出 PromptValue。</p>
<p>第三步：该model组件采用生成的提示，并传递到 OpenAI LLM 模型进行评估。模型生成的输出是一个ChatMessage对象。</p>
<p>第四步：最后，该output_parser组件接收 aChatMessage并将其转换为 Python 字符串，该字符串从 invoke 方法返回。</p>
<figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br></pre></td><td class="code"><pre><span class="line">!pip install pydantic==1.10.13</span><br><span class="line">!pip install docarray==0.32.1</span><br></pre></td></tr></table></figure>


<figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br><span class="line">43</span><br><span class="line">44</span><br><span class="line">45</span><br><span class="line">46</span><br><span class="line">47</span><br><span class="line">48</span><br><span class="line">49</span><br><span class="line">50</span><br><span class="line">51</span><br><span class="line">52</span><br><span class="line">53</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> langchain.chat_models <span class="keyword">import</span> ChatOpenAI</span><br><span class="line"><span class="keyword">from</span> langchain.prompts <span class="keyword">import</span> ChatPromptTemplate</span><br><span class="line"><span class="keyword">from</span> langchain.vectorstores <span class="keyword">import</span> DocArrayInMemorySearch</span><br><span class="line"><span class="keyword">from</span> langchain.embeddings <span class="keyword">import</span> HuggingFaceBgeEmbeddings</span><br><span class="line"><span class="keyword">from</span> langchain_core.output_parsers <span class="keyword">import</span> StrOutputParser</span><br><span class="line"><span class="keyword">from</span> langchain_core.runnables <span class="keyword">import</span> RunnableMap</span><br><span class="line"><span class="keyword">import</span> os</span><br><span class="line"></span><br><span class="line">bge_embeddings = HuggingFaceBgeEmbeddings(model_name=<span class="string">&quot;BAAI/bge-large-zh-v1.5&quot;</span>)</span><br><span class="line">vectordb = DocArrayInMemorySearch.from_texts(</span><br><span class="line">    [</span><br><span class="line">        <span class="string">&quot;小明在广州工作&quot;</span>,</span><br><span class="line">        <span class="string">&quot;我和小明是好朋友，他现年35岁&quot;</span>,</span><br><span class="line">        <span class="string">&quot;我说嘿，你说嘿嘿!&quot;</span>,</span><br><span class="line">        <span class="string">&quot;青蛙是食草动物&quot;</span>,</span><br><span class="line">        <span class="string">&quot;人是由恐龙进化而来的。&quot;</span>,</span><br><span class="line">        <span class="string">&quot;熊猫喜欢吃天鹅肉。&quot;</span>,</span><br><span class="line">        <span class="string">&quot;1+1=5&quot;</span>,</span><br><span class="line">        <span class="string">&quot;2+2=8&quot;</span>,</span><br><span class="line">        <span class="string">&quot;3+3=9&quot;</span></span><br><span class="line">    ],</span><br><span class="line">    embedding=bge_embeddings </span><br><span class="line">)</span><br><span class="line"> </span><br><span class="line"><span class="comment"># #创建检索器</span></span><br><span class="line">bge_retriever = vectordb.as_retriever(search_kwargs=&#123;<span class="string">&quot;k&quot;</span>: <span class="number">1</span>&#125;)</span><br><span class="line"></span><br><span class="line"><span class="comment"># template = &quot;&quot;&quot;Answer the question a full sentence, </span></span><br><span class="line"><span class="comment"># based only on the following context:</span></span><br><span class="line"><span class="comment"># &#123;context&#125;</span></span><br><span class="line"><span class="comment"># Question: &#123;question&#125;</span></span><br><span class="line"><span class="comment"># &quot;&quot;&quot;</span></span><br><span class="line"></span><br><span class="line">template = <span class="string">&quot;&quot;&quot;</span></span><br><span class="line"><span class="string">基于以下已知信息，简洁和专业的来回答用户的问题。</span></span><br><span class="line"><span class="string">如果无法从中得到答案，请说&quot;根据已知信息无法回答该问题&quot; 或 &quot;没有提供足够的相关信息&quot;，不允许在答案中添加编造成分，答案请使用中文。</span></span><br><span class="line"><span class="string">已知内容:</span></span><br><span class="line"><span class="string">&#123;context&#125;</span></span><br><span class="line"><span class="string"></span></span><br><span class="line"><span class="string">问题:</span></span><br><span class="line"><span class="string">&#123;question&#125;</span></span><br><span class="line"><span class="string">&quot;&quot;&quot;</span></span><br><span class="line"></span><br><span class="line">prompt = ChatPromptTemplate.from_template(template)</span><br><span class="line">model = ChatOpenAI(model=<span class="string">&quot;chatglm3-6b&quot;</span>, openai_api_base=<span class="string">&quot;http://127.0.0.1:8000/v1&quot;</span>, openai_api_key=<span class="string">&quot;abcabc&quot;</span>)</span><br><span class="line"></span><br><span class="line">chain = chain = RunnableMap(&#123;</span><br><span class="line">    <span class="string">&quot;context&quot;</span>: <span class="keyword">lambda</span> x: bge_retriever.get_relevant_documents(x[<span class="string">&quot;question&quot;</span>]),</span><br><span class="line">    <span class="string">&quot;question&quot;</span>: <span class="keyword">lambda</span> x: x[<span class="string">&quot;question&quot;</span>]</span><br><span class="line">&#125;) | prompt | model | StrOutputParser()</span><br><span class="line"></span><br><span class="line">response = chain.invoke(&#123;<span class="string">&quot;question&quot;</span>:<span class="string">&quot;小明现年几岁？&quot;</span>&#125;)</span><br><span class="line"><span class="built_in">print</span>(response)</span><br></pre></td></tr></table></figure>


<p>过程：</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704651741534.png" alt="1704651741534"></p>
<h3 id="5-7-LangChain例子3-信息提取"><a href="#5-7-LangChain例子3-信息提取" class="headerlink" title="5.7 LangChain例子3 - 信息提取"></a>5.7 LangChain例子3 - 信息提取</h3><p>信息提取：</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704651753710.png" alt="1704651753710"></p>
<figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> langchain.chains <span class="keyword">import</span> create_extraction_chain</span><br><span class="line"><span class="keyword">from</span> langchain.chat_models <span class="keyword">import</span> ChatOpenAI</span><br><span class="line"></span><br><span class="line">schema = &#123;</span><br><span class="line">    <span class="string">&quot;properties&quot;</span>: &#123;</span><br><span class="line">        <span class="string">&quot;name&quot;</span>: &#123;<span class="string">&quot;type&quot;</span>: <span class="string">&quot;string&quot;</span>&#125;,</span><br><span class="line">        <span class="string">&quot;height&quot;</span>: &#123;<span class="string">&quot;type&quot;</span>: <span class="string">&quot;integer&quot;</span>&#125;,</span><br><span class="line">        <span class="string">&quot;age&quot;</span>: &#123;<span class="string">&quot;type&quot;</span>: <span class="string">&quot;integer&quot;</span>&#125;,</span><br><span class="line">        <span class="string">&quot;hair_color&quot;</span>: &#123;<span class="string">&quot;type&quot;</span>: <span class="string">&quot;string&quot;</span>&#125;</span><br><span class="line">    &#125;,</span><br><span class="line">    <span class="string">&quot;required&quot;</span>: [<span class="string">&quot;name&quot;</span>, <span class="string">&quot;height&quot;</span>, <span class="string">&quot;age&quot;</span>]</span><br><span class="line">&#125;</span><br><span class="line"></span><br><span class="line">inp = <span class="string">&quot;&quot;&quot;去年小明15岁，今年身高130cm。今年小红6岁，身高140, 我需要json格式&quot;&quot;&quot;</span></span><br><span class="line"></span><br><span class="line">model = ChatOpenAI(model=<span class="string">&quot;chatglm3-6b&quot;</span>, openai_api_base=<span class="string">&quot;http://127.0.0.1:8000/v1&quot;</span>, openai_api_key=<span class="string">&quot;abcabc&quot;</span>)</span><br><span class="line">chain = create_extraction_chain(schema, model)</span><br><span class="line">chain.invoke(inp)</span><br></pre></td></tr></table></figure>


<p>输出结果：</p>
<figure class="highlight plaintext"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br></pre></td><td class="code"><pre><span class="line">&#123;&#x27;input&#x27;: &#x27;去年小明15岁，今年身高130cm。今年小红6岁，身高140, 我需要json格式&#x27;,</span><br><span class="line"> &#x27;text&#x27;: [&#123;&#x27;name&#x27;: &#x27;小明&#x27;, &#x27;height&#x27;: 130, &#x27;age&#x27;: 15&#125;,</span><br><span class="line">  &#123;&#x27;name&#x27;: &#x27;小红&#x27;, &#x27;height&#x27;: 140, &#x27;age&#x27;: 6&#125;]&#125;</span><br></pre></td></tr></table></figure>


<h3 id="5-8-LangChain例子4-与数据库结合"><a href="#5-8-LangChain例子4-与数据库结合" class="headerlink" title="5.8 LangChain例子4 - 与数据库结合"></a>5.8 LangChain例子4 - 与数据库结合</h3><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> langchain.chat_models <span class="keyword">import</span> ChatOpenAI</span><br><span class="line"><span class="keyword">from</span> langchain.utilities <span class="keyword">import</span> SQLDatabase</span><br><span class="line"><span class="keyword">from</span> langchain_experimental.sql <span class="keyword">import</span> SQLDatabaseChain</span><br><span class="line"></span><br><span class="line">db = SQLDatabase.from_uri(<span class="string">&quot;sqlite:///C:\\Users\\22815\\Desktop\\hahaha.db&quot;</span>)</span><br><span class="line">model = ChatOpenAI(model=<span class="string">&quot;chatglm3-6b&quot;</span>, openai_api_base=<span class="string">&quot;http://127.0.0.1:8000/v1&quot;</span>, openai_api_key=<span class="string">&quot;abcabc&quot;</span>)</span><br><span class="line">db_chain = SQLDatabaseChain.from_llm(model, db, verbose=<span class="literal">True</span>)</span><br><span class="line"></span><br><span class="line">db_chain.run(<span class="string">&quot;帮我找年龄低于28岁的人的信息，以文本的方式返回&quot;</span>)</span><br></pre></td></tr></table></figure>


<p>创建sql语句的工具</p>
<figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> langchain.chat_models <span class="keyword">import</span> ChatOpenAI</span><br><span class="line"><span class="keyword">from</span> langchain.utilities <span class="keyword">import</span> SQLDatabase</span><br><span class="line"><span class="keyword">from</span> langchain_experimental.sql <span class="keyword">import</span> SQLDatabaseChain</span><br><span class="line"><span class="keyword">from</span> langchain.chains.sql_database.query <span class="keyword">import</span> create_sql_query_chain</span><br><span class="line"></span><br><span class="line">db = SQLDatabase.from_uri(<span class="string">&quot;sqlite:///C:\\Users\\22815\\Desktop\\hahaha.db&quot;</span>)</span><br><span class="line">model = ChatOpenAI(model=<span class="string">&quot;chatglm3-6b&quot;</span>, openai_api_base=<span class="string">&quot;http://127.0.0.1:8000/v1&quot;</span>, openai_api_key=<span class="string">&quot;abcabc&quot;</span>)</span><br><span class="line"></span><br><span class="line">db_chain = create_sql_query_chain(model, db)</span><br><span class="line">query = db_chain.invoke(&#123;<span class="string">&quot;question&quot;</span>: <span class="string">&quot;随便找&quot;</span>&#125;)</span><br><span class="line"><span class="built_in">print</span>(query)</span><br></pre></td></tr></table></figure>


<h3 id="5-7-其它微调框架"><a href="#5-7-其它微调框架" class="headerlink" title="5.7 其它微调框架"></a>5.7 其它微调框架</h3><h4 id="5-7-1-lamini微调小例子"><a href="#5-7-1-lamini微调小例子" class="headerlink" title="5.7.1 lamini微调小例子"></a>5.7.1 lamini微调小例子</h4><p> <span style='display: inline-block; width: 3.6rem;'></span>官方代码：<a target="_blank" rel="noopener" href="https://github.com/lamini-ai/lamini">https://github.com/lamini-ai/lamini</a></p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>Lamini是领先的大语言模型微调平台。可以使每个企业和开发人员都能轻松构建定制的私有模型：比任何一般的大语言模型更容易、更快、性能更高。</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704651426222.png" alt="1704651426222"></p>
<p>输出：{</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>‘age’: 25,</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>‘units’: ‘years’</p>
<p>}</p>
<h4 id="5-7-2-lamini训练小例子"><a href="#5-7-2-lamini训练小例子" class="headerlink" title="5.7.2 lamini训练小例子"></a>5.7.2 lamini训练小例子</h4><p>准备数据：</p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704651492099.png" alt="1704651492099"></p>
<p><img src="/images/%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2%E5%8F%8A%E5%BE%AE%E8%B0%83/1704651506082.png" alt="1704651506082"></p>
<h2 id="第六章-大语言模型微调-PEFT"><a href="#第六章-大语言模型微调-PEFT" class="headerlink" title="第六章 大语言模型微调 - PEFT"></a>第六章 大语言模型微调 - PEFT</h2><h3 id="6-1-提示词的局限性"><a href="#6-1-提示词的局限性" class="headerlink" title="6.1 提示词的局限性"></a>6.1 提示词的局限性</h3><p>1、上下文窗口长度有限。<br>2、小模型无法正常通过上下文学习</p>
<p>大语言模型从零开始训练，通常需要巨量的数据：GB级别、TB级别、PB级别，训练完成后的模型称为预训练模型。</p>
<p>微调大语言模型<br>微调：需要基于预训练模型进行针对性的、特定一个或多个问题对模型进行二次训练。</p>
<h3 id="6-2-数据准备"><a href="#6-2-数据准备" class="headerlink" title="6.2 数据准备"></a>6.2 数据准备</h3><p> 在训练前需要准备的训练数据格式为：问题以及标准答案。</p>
<p>  比如分类任务：<br>    问题：《功夫》这部电影怎么样？标准答案：好<br>    问题：坏苹果好吃吗？标准答案：不好</p>
<p>  比如总结任务：<br>    问题：JS通常是JavaScript的缩写，它是一种高级的、解释型编程语言，广泛用于网页开发中，用于实现网页的交互效果和动态内容。JavaScript最初由Netscape公司的 Brendan Eich 在1995年设计，后来得到了广泛的标准化和 adoption，成为Web开发不可或缺的一部分。<br>    标准答案：JavaScript（简称JS）是一种高级编程语言，主要用于网页开发以增加交互性和动态内容。它在1995年由Netscape公司的Brendan Eich设计，并逐渐被标准化和广泛采用，成为Web开发中不可或缺的技术之一。</p>
<p>  比如翻译任务：<br>    问题：请将“外卖”翻译成英文。 标准答案：Delivery service (food delivery)<br>    问题：请将“电子商务”翻译成英文。 标准答案：E-commerce (Electronic Commerce)<br>    问题：请将“移动支付”翻译成英文。 标准答案：Mobile payment<br>    问题：请将“共享单车”翻译成英文。 标准答案：Shared bicycles (bike-sharing)</p>
<p>  通常需要将数据划分成：训练集、验证集、测试集</p>
<h3 id="6-3-微调大语言模型分为两种方式："><a href="#6-3-微调大语言模型分为两种方式：" class="headerlink" title="6.3 微调大语言模型分为两种方式："></a>6.3 微调大语言模型分为两种方式：</h3><h4 id="6-3-1-全量微调"><a href="#6-3-1-全量微调" class="headerlink" title="6.3.1 全量微调"></a>6.3.1 全量微调</h4><p> <span style='display: inline-block; width: 3.6rem;'></span>全量微调需要更新模型的所有参数。</p>
<h4 id="6-3-2-PEFT微调"><a href="#6-3-2-PEFT微调" class="headerlink" title="6.3.2 PEFT微调"></a>6.3.2 PEFT微调</h4><p> <span style='display: inline-block; width: 3.6rem;'></span>Lora微调：LoRA（Low-Rank Adaptation）</p>
<h3 id="6-4-微调的过程："><a href="#6-4-微调的过程：" class="headerlink" title="6.4 微调的过程："></a>6.4 微调的过程：</h3><p>训练过程会将训练集中的数据逐个取出，交给预训练模型进行推理。推理后通过交叉熵计算损失值。</p>
<p>通常微调一个任务仅需要500~1000个相关的问题即可。</p>
<h3 id="6-5-灾难性遗忘"><a href="#6-5-灾难性遗忘" class="headerlink" title="6.5 灾难性遗忘"></a>6.5 灾难性遗忘</h3><p>虽然微调可以让特定任务的问题回答得更加准确，但是亦会带来另外一个问题，那就是微调训练过程中影响了原本的参数，导致模型遗忘原来的信息。从而导致推理其它任务的效果下降。</p>
<p>那么如何避免灾难性遗忘呢？<br>1、也许你不需要微调也能通过提示工程完成你的任务<br>2、多任务同时微调，同时针对不同的任务进行微调，如分类、翻译、总结、信息提取。<br>3、通过参数高效微调PEFT的方式如Lora，进行微调</p>
<p>FLAN（Fine-tuned Language net）,是谷歌研究开发的一种先进的自然语言处理模型。许多开发者喜欢使用该模型进行微调，但是遗憾的是它只支持英文。</p>
<h3 id="6-6-模型评估指标"><a href="#6-6-模型评估指标" class="headerlink" title="6.6 模型评估指标"></a>6.6 模型评估指标</h3><p>以下是常用的模型评估指标及其定义和公式：</p>
<h4 id="6-6-1-准确率（Accuracy）"><a href="#6-6-1-准确率（Accuracy）" class="headerlink" title="6.6.1 准确率（Accuracy）"></a>6.6.1 准确率（Accuracy）</h4><ul>
<li><p>定义：正确预测的样本数占总样本数的比例。</p>
</li>
<li><p>公式：<br>$$<br>\text{Accuracy} &#x3D; \frac{\text{TP} + \text{TN}}{\text{TP} + \text{TN} + \text{FP} + \text{FN}}<br>$$</p>
</li>
</ul>
<h4 id="6-6-2-精确率（Precision）也称为查准率"><a href="#6-6-2-精确率（Precision）也称为查准率" class="headerlink" title="6.6.2 精确率（Precision）也称为查准率"></a>6.6.2 精确率（Precision）也称为查准率</h4><ul>
<li>定义：被预测为正例的样本中，实际为正例的比例。</li>
<li>公式：</li>
</ul>
<p>$$<br>\text{Precision} &#x3D; \frac{\text{TP}}{\text{TP} + \text{FP}}召回率（Recall）**，也称为查全率<br>$$</p>
<h4 id="6-6-3-召回率（Recall）也称为查全率"><a href="#6-6-3-召回率（Recall）也称为查全率" class="headerlink" title="6.6.3 召回率（Recall）也称为查全率"></a>6.6.3 召回率（Recall）也称为查全率</h4><ul>
<li><p>定义：实际为正例的样本中，被正确预测为正例的比例。</p>
</li>
<li><p>公式：<br>$$<br>\text{Recall} &#x3D; \frac{\text{TP}}{\text{TP} + \text{FN}}<br>$$</p>
</li>
</ul>
<h4 id="6-6-4-F1分数（F1-Score）"><a href="#6-6-4-F1分数（F1-Score）" class="headerlink" title="6.6.4 F1分数（F1-Score）"></a>6.6.4 F1分数（F1-Score）</h4><ul>
<li>定义：精确率和召回率的调和平均值，用于衡量模型的精确性和稳健性。</li>
<li>公式：</li>
</ul>
<p>$$<br>\text{F1-Score} &#x3D; 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}<br>$$</p>
<h4 id="6-6-5-ROUGE（Recall-Oriented-Understudy-for-Gisting-Evaluation）"><a href="#6-6-5-ROUGE（Recall-Oriented-Understudy-for-Gisting-Evaluation）" class="headerlink" title="6.6.5 ROUGE（Recall-Oriented Understudy for Gisting Evaluation）"></a>6.6.5 ROUGE（Recall-Oriented Understudy for Gisting Evaluation）</h4><p> <span style='display: inline-block; width: 3.6rem;'></span>定义：主要用于自动文摘和机器翻译的评价指标，衡量系统的摘要与原文的相似度。</p>
<h5 id="ROUGE-1指标例子1："><a href="#ROUGE-1指标例子1：" class="headerlink" title="ROUGE-1指标例子1："></a>ROUGE-1指标例子1：</h5><p>人类生成的标准：The cat sat on the mat.<br>大语言模型推理：The mouse watched the cat on the mat.</p>
<table>
<thead>
<tr>
<th>公式</th>
<th>结果</th>
<th>备注</th>
</tr>
</thead>
<tbody><tr>
<td>$$\text{ROUGE-1 Recall}&#x3D;\frac{\text{unigram matches}}{\text{unigrams in reference}}$$</td>
<td>$\frac{3}{4} &#x3D; 0.75$</td>
<td>ROUGE-1 召回率</td>
</tr>
<tr>
<td>$$\text{ROUGE-1 Precision}&#x3D;\frac{\text{unigram matches}}{\text{unigrams in output}}$$</td>
<td>$\frac{3}{5} &#x3D; 0.6$</td>
<td>ROUGE-1 精确率</td>
</tr>
<tr>
<td>$$\text{ROUGE-1 F1}&#x3D;2\frac{\text{precision x recall}}{\text{precision + recall}}$$</td>
<td>$2\frac{0.6 \times 0.75}{0.6 + 0.75} \approx 0.68$</td>
<td>ROUGE-1 F1分数</td>
</tr>
</tbody></table>
<h5 id="ROUGE-1指标作弊例子2："><a href="#ROUGE-1指标作弊例子2：" class="headerlink" title="ROUGE-1指标作弊例子2："></a>ROUGE-1指标作弊例子2：</h5><p>人类生成的标准：It is cold outside.<br>大语言模型推理：cold,cold,cold,cold.</p>
<table>
<thead>
<tr>
<th>公式</th>
<th>结果</th>
<th>备注</th>
</tr>
</thead>
<tbody><tr>
<td>$$\text{ROUGE-1 Recall}&#x3D;\frac{\text{unigram matches}}{\text{unigrams in reference}}$$</td>
<td>$\frac{4}{4} &#x3D; 1.0$</td>
<td>ROUGE-1 召回率</td>
</tr>
<tr>
<td>$$\text{ROUGE-1 Precision}&#x3D;\frac{\text{unigram matches}}{\text{unigrams in output}}$$</td>
<td>$\frac{4}{4} &#x3D; 1.0$</td>
<td>ROUGE-1 精确率</td>
</tr>
<tr>
<td>$$\text{ROUGE-1 F1}&#x3D;2\frac{\text{precision x recall}}{\text{precision + recall}}$$</td>
<td>$2\frac{1.0 \times 1.0}{1.0 + 1.0} &#x3D; 1.0$</td>
<td>ROUGE-1 F1分数</td>
</tr>
</tbody></table>
<h5 id="ROUGE-1指标反作弊例子3："><a href="#ROUGE-1指标反作弊例子3：" class="headerlink" title="ROUGE-1指标反作弊例子3："></a>ROUGE-1指标反作弊例子3：</h5><p>人类生成的标准：It is cold outside.<br>大语言模型推理：cold,cold,cold,cold.</p>
<table>
<thead>
<tr>
<th>公式</th>
<th>结果</th>
<th>备注</th>
</tr>
</thead>
<tbody><tr>
<td>$$\text{ROUGE-1 Recall}&#x3D;\frac{\text{unigram matches}}{\text{unigrams in reference}}$$</td>
<td>$\frac{4}{4} &#x3D; 1.0$</td>
<td>ROUGE-1 召回率</td>
</tr>
<tr>
<td>$$\text{ROUGE-1 Precision改版}&#x3D;\frac{\text{clip(unigram matches)}}{\text{unigrams in output}}$$</td>
<td>$\frac{1}{4} &#x3D; 0.25$</td>
<td>ROUGE-1 精确率</td>
</tr>
<tr>
<td>$$\text{ROUGE-1 F1改版}&#x3D;2\frac{\text{clip(precision x recall)}}{\text{precision + recall}}$$</td>
<td>$2\frac{1.0 \times 0.25}{1.0 + 0.25} &#x3D; 0.4$</td>
<td>ROUGE-1 F1分数</td>
</tr>
</tbody></table>
<h5 id="ROUGE-2指标例子4："><a href="#ROUGE-2指标例子4：" class="headerlink" title="ROUGE-2指标例子4："></a>ROUGE-2指标例子4：</h5><p>人类生成的标准：”The sun sets in the west, and the moon rises in the east.”<br>模型推理文本： “The sun dips in the direction of the setting west, as the moon climbs in the opposite direction from the rising east.”</p>
<table>
<thead>
<tr>
<th>公式</th>
<th>结果</th>
<th>备注</th>
</tr>
</thead>
<tbody><tr>
<td>$$\text{ROUGE-2 Recall}&#x3D;\frac{\text{bigrams matches}}{\text{bigrams in reference}}$$</td>
<td>$\frac{3}{8} &#x3D; 0.375$</td>
<td>ROUGE-2 召回率</td>
</tr>
<tr>
<td>$$\text{ROUGE-2 Precision}&#x3D;\frac{\text{bigrams matches}}{\text{bigrams in output}}$$</td>
<td>$\frac{3}{10} &#x3D; 0.3$</td>
<td>ROUGE-2 精确率</td>
</tr>
<tr>
<td>$$\text{ROUGE-2 F1}&#x3D;2\frac{\text{precision x recall}}{\text{precision + recall}}$$</td>
<td>$2\frac{0.3 \times 0.375}{0.3 + 0.375} \approx 0.328$</td>
<td>ROUGE-2 F1分数</td>
</tr>
</tbody></table>
<h5 id="ROUGE-L指标例子5"><a href="#ROUGE-L指标例子5" class="headerlink" title="ROUGE-L指标例子5"></a>ROUGE-L指标例子5</h5><p>参考文本（人类生成）：”It is cold outside.”<br>模型推理文本： “It is very cold outside.”</p>
<table>
<thead>
<tr>
<th>公式</th>
<th>结果</th>
<th>备注</th>
</tr>
</thead>
<tbody><tr>
<td>$$\text{ROUGE-L Recall}&#x3D;\frac{\text{LCS length}}{\text{reference text length}}$$</td>
<td>$\frac{9}{10} &#x3D; 0.9$</td>
<td>ROUGE-L 召回率</td>
</tr>
<tr>
<td>$$\text{ROUGE-L Precision}&#x3D;\frac{\text{LCS length}}{\text{system text length}}$$</td>
<td>$\frac{9}{11} \approx 0.818$</td>
<td>ROUGE-L 精确率</td>
</tr>
<tr>
<td>$$\text{ROUGE-L F1}&#x3D;2\frac{\text{precision x recall}}{\text{precision + recall}}$$</td>
<td>$2\frac{0.9 \times 0.818}{0.9 + 0.818} \approx 0.863$</td>
<td>ROUGE-L F1分数</td>
</tr>
</tbody></table>
<ol start="6">
<li><strong>BLEU SCORE</strong><br> 定义：一个用于评估机器翻译质量的指标，基于与参考翻译的相似度来计算。</li>
</ol>
<p>其他常用的评估指标包括：</p>
<ul>
<li><strong>MSE（Mean Squared Error）</strong>：用于回归问题的平均平方误差，衡量预测值与真实值之间的差异。</li>
<li><strong>MAE（Mean Absolute Error）</strong>：用于回归问题的平均绝对误差，也是衡量预测值与真实值差异的一种指标。</li>
<li><strong>ROC曲线（Receiver Operating Characteristic Curve）</strong>和<strong>AUC（Area Under ROC Curve）</strong>：用于二分类问题，ROC曲线展示的是分类阈值变化时，真正例率（TPR）和假正例率（FPR）的关系，AUC则是ROC曲线下的面积，衡量模型的总体性能。</li>
<li><strong>Precision-Recall Curve</strong>：展示的是精确率和召回率的关系曲线，用于评估模型对不同类别的重要性。</li>
</ul>
<h3 id="6-1-大型语言模型的调优技巧Fine-Tune"><a href="#6-1-大型语言模型的调优技巧Fine-Tune" class="headerlink" title="6.1 大型语言模型的调优技巧Fine-Tune"></a>6.1 大型语言模型的调优技巧Fine-Tune</h3><p>大型语言模型的调优技巧Fine-Tuning（简称FT）是一种在自然语言处理（NLP）中常用的技术，用于将预训练的语言模型适应于特定任务或领域。Fine-Tuning的基本思想是采用已经在大量文本上进行训练的预训练语言模型，然后在小规模的任务特定文本上继续训练它。以下是Fine-Tuning的一些常见技巧：</p>
<ol>
<li><strong>数据准备</strong>：为Fine-Tuning准备高质量的数据集，包括训练集、验证集和测试集。确保数据集与任务相关且具有代表性。</li>
<li><strong>模型选择</strong>：选择一个与任务相关的预训练模型。例如，GPT-3或BERT模型。</li>
<li><strong>参数设置</strong>：在Fine-Tuning过程中，可以根据任务需求调整模型的超参数，如学习率、批次大小、迭代次数等。</li>
<li><strong>冻结与解冻</strong>：在Fine-Tuning过程中，可以选择冻结预训练模型的部分层，只训练与任务最相关的层。这有助于提高训练效率并防止过拟合。</li>
<li><strong>早期停止</strong>：在训练过程中，定期评估模型在验证集上的性能。当性能不再提升时，可以停止训练以避免过拟合。</li>
<li><strong>正则化</strong>：在Fine-Tuning过程中，可以采用正则化技术（如dropout、权重衰减等）来防止过拟合。</li>
<li><strong>多任务学习</strong>：在Fine-Tuning过程中，可以考虑将多个任务的数据集混合在一起进行训练。这有助于提高模型的泛化能力。</li>
<li><strong>动态学习率</strong>：在Fine-Tuning过程中，可以设置动态学习率，使模型在不同阶段采用不同的学习率。</li>
<li><strong>注意力机制</strong>：利用预训练模型中的注意力机制，可以根据任务需求调整注意力权重，使模型更加关注与任务相关的信息。</li>
<li><strong>Prompt Tuning</strong>：在输入数据前添加与任务相关的提示（prompt），引导模型生成所需的输出。这种方法可以进一步提高模型在特定任务上的性能。</li>
</ol>
<h3 id="6-2-全量微调介绍"><a href="#6-2-全量微调介绍" class="headerlink" title="6.2 全量微调介绍"></a>6.2 全量微调介绍</h3><p> <span style='display: inline-block; width: 3.6rem;'></span>大语言模型全量微调（Full Fine-tuning of Large Language Models）是指对预训练的大型语言模型（如GPT-3、BERT等）进行微调的过程，以适应特定的下游任务。在这个过程中，模型的所有参数都被重新训练，以便更好地适应该任务。全量微调通常涉及到大量的计算资源和时间，因为需要对模型的数十亿个参数进行调整。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>PEFT（Parameter-Efficient Fine-tuning）是一种参数效率更高的微调方法，它通过只微调模型的一部分参数来减少计算资源的需求。PEFT的核心思想是冻结预训练模型的大部分权重，只训练与特定任务最相关的部分。这种方法通常涉及到在模型的输入层或输出层添加额外的可训练层，或者通过低秩分解等技术来减少需要微调的参数数量。</p>
<p><strong>区别</strong>：</p>
<ol>
<li><strong>参数调整</strong>：在全量微调中，模型的所有参数都会被调整；而在PEFT中，只有部分参数被调整，通常是那些与任务最相关的参数。</li>
<li><strong>计算资源</strong>：全量微调通常需要更多的计算资源，因为它涉及到调整更多的参数；PEFT则需要较少的计算资源，因为它只调整少量的参数。</li>
<li><strong>时间</strong>：全量微调可能需要更长的时间来完成，因为它需要对更多的参数进行训练；PEFT通常可以更快地完成，因为它只需要训练少量的参数。</li>
<li><strong>性能</strong>：全量微调可能会在特定任务上提供更高的性能，因为它对模型的所有参数进行了调整；PEFT的性能可能略低于全量微调，但它提供了一种更高效的微调方法，可以在资源有限的情况下使用。</li>
</ol>
<h3 id="6-3-Lora微调原理"><a href="#6-3-Lora微调原理" class="headerlink" title="6.3 Lora微调原理"></a>6.3 Lora微调原理</h3><p> <span style='display: inline-block; width: 3.6rem;'></span>大语言模型微调（Fine-Tuning, FT）是一种常见的机器学习技术，用于将预训练的语言模型适应于特定的下游任务。微调的过程通常包括在任务特定的数据集上对模型进行进一步的训练，以便模型能够学习到与任务相关的特定知识。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>然而，微调大型语言模型（如GPT-3）可能会遇到计算资源不足和训练时间过长的问题。为了解决这些问题，研究者提出了多种参数效率的微调方法，其中一种是LoRA（Low-Rank Adaptation）。</p>
<p>LoRA的微调原理基于以下几个关键点：</p>
<ol>
<li><strong>低秩分解</strong>：LoRA通过将预训练模型的权重矩阵分解为低秩的矩阵乘积，来减少需要微调的参数数量。这种分解通常涉及到奇异值分解（SVD）或类似的数学技术。</li>
<li><strong>参数效率</strong>：通过低秩分解，LoRA能够将原始模型的权重矩阵替换为较小的矩阵，从而减少了微调过程中需要更新的参数数量。这大大降低了计算成本和训练时间。</li>
<li><strong>适应性</strong>：LoRA通过在低秩分解的基础上添加一些额外的参数（如旁路矩阵）来模拟全参数微调的效果。这些额外参数的学习可以捕捉到任务特定的特征，同时保持模型的整体结构。</li>
<li><strong>训练过程</strong>：在微调过程中，LoRA方法只更新分解后的低秩矩阵和额外参数，而冻结了原始预训练模型的其余部分。这使得训练过程更加高效，因为只有一小部分参数需要被调整。</li>
<li><strong>性能</strong>：尽管LoRA减少了微调的参数数量，但它仍然能够保持或接近全参数微调的性能。这是因为低秩分解能够保留原始模型的大部分重要信息，同时允许模型适应新的任务。<br>LoRA方法的出现显著提高了大型语言模型微调的效率，使得在资源有限的情况下也能够有效地适应新任务。这种方法已经在多个NLP任务中得到了应用，并取得了良好的效果。</li>
</ol>
<h3 id="6-4-Lora微调实验"><a href="#6-4-Lora微调实验" class="headerlink" title="6.4 Lora微调实验"></a>6.4 Lora微调实验</h3><p>参考：<a target="_blank" rel="noopener" href="https://www.heywhale.com/mw/project/6436d82948f7da1fee2be59e">https://www.heywhale.com/mw/project/6436d82948f7da1fee2be59e</a></p>
<h2 id="第七章-应用实践"><a href="#第七章-应用实践" class="headerlink" title="第七章 应用实践"></a>第七章 应用实践</h2><h3 id="7-1-需求分析"><a href="#7-1-需求分析" class="headerlink" title="7.1 需求分析"></a>7.1 需求分析</h3><p><strong>项目名称：</strong>智能客服系统</p>
<p><strong>项目目标：</strong></p>
<ol>
<li>提供自动化的客户服务，减轻人工客服负担。</li>
<li>提高客户服务效率，减少等待时间。</li>
<li>提升客户满意度，准确快速解答问题。</li>
<li>收集分析客户反馈，改进产品服务。</li>
</ol>
<p><strong>功能需求：</strong></p>
<ol>
<li>多接入方式：支持网站、移动应用、电话等。</li>
<li>自然语言处理：理解用户输入，提供解答。</li>
<li>问题分类：自动分类，快速响应。</li>
<li>知识库检索：准确解答问题。</li>
<li>智能推荐：根据历史提供产品推荐。</li>
<li>多轮对话管理：处理复杂对话，保持连贯性。</li>
<li>异常处理：转接人工客服或提供替代方案。</li>
<li>用户反馈收集：用于后续优化。</li>
</ol>
<p><strong>技术需求：</strong></p>
<ol>
<li>大语言模型：使用ChatGLM。</li>
<li>知识库：使用LangChain和ChromaDB。</li>
<li>系统集成：与现有系统无缝集成。</li>
</ol>
<h3 id="7-2-构建智能客服系统"><a href="#7-2-构建智能客服系统" class="headerlink" title="7.2 构建智能客服系统"></a>7.2 构建智能客服系统</h3><h2 id="第八章-总结"><a href="#第八章-总结" class="headerlink" title="第八章 总结"></a>第八章 总结</h2><p> <span style='display: inline-block; width: 3.6rem;'></span>在这五天的学习中，我们一同探索了人工智能世界的奥妙。我们了解了ChatGLM3，这个能够理解和生成自然语言的聊天机器人，以及LangChain，一个连接不同知识和算法的强大工具。我们还学习了如何在Azure平台上使用OpenAl服务，这让我们对云计算有了更深入的认识。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>我们深入到了语言模型的核心，学习了如何将词语转化为数字的词嵌入，如何让机器理解语言的位置，以及Transformer模型是如何改变自然语言处理的的游戏规则。我们也了解了作为提示词工程师的挑战和乐趣。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>在动手实践环节，我们亲自部署了ChatGLM3-6B，感受到了大型语言模型的强大功能。我们还学习了如何使用ChromaDB这个向量数据库，它能够高效地存储和检索信息，让我们的模型能够更快地响应。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>LangChain的原理和实践也让我们眼界大开，我们通过各种例子学习了如何用它来提升模型的性能。我们还了解了微调的概念，学习了如何通过全量微调和PEFT微调来优化我们的模型。</p>
<p> <span style='display: inline-block; width: 3.6rem;'></span>最后，我们将所学应用到实际中，构建了一个智能客服系统，这让我们对大语言模型的实际应用有了更深的理解。这五天学习不仅提升了我们的技术能力，也激发了我们对于人工智能的无限热情。</p>

                                      </div>
                                      
                                        <div class="prev-or-next">
                                          <div class="post-foot-next">
                                            
                                              <a href="/2023/12/06/Svelte%E6%A1%86%E6%9E%B6%E5%9F%BA%E7%A1%80/" target="_self">
                                                <i class="iconfont icon-chevronleft"></i>
                                                <span>
                                                  上一页
                                                </span>
                                              </a>
                                              
                                          </div>
                                          <div class="post-attach">
                                            <span class="post-pubtime">
                                              <i class="iconfont icon-updatetime mr-10"
                                                title="更新时间"></i>
                                              2024-10-22 14:52:45
                                            </span>
                                            
                                              <span class="post-tags">
                                                <i class="iconfont icon-tags mr-10" title="标签"></i>
                                                
                                                  <span class="span--tag mr-8">
                                                    <a href="/tags/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/" title="人工智能">
                                                      #人工智能
                                                    </a>
                                                  </span>
                                                  
                                                  <span class="span--tag mr-8">
                                                    <a href="/tags/LLM/" title="LLM">
                                                      #LLM
                                                    </a>
                                                  </span>
                                                  
                                              </span>
                                              
                                          </div>
                                          <div class="post-foot-prev">
                                            
                                              <a href="/2024/02/23/Numpy%E5%9F%BA%E7%A1%80/" target="_self">
                                                <span>
                                                  下一页
                                                </span>
                                                <i class="iconfont icon-chevronright"></i>
                                              </a>
                                              
                                          </div>
                                        </div>
                                        
                                    </div>
                                    
  <div id="btn-catalog" class="btn-catalog">
    <i class="iconfont icon-catalog"></i>
  </div>
  <div class="post-catalog hidden" id="catalog">
    <div class="title">目录</div>
    <div class="catalog-content">
      
        <ol class="toc"><li class="toc-item toc-level-2"><a class="toc-link" href="#%E5%89%8D%E8%A8%80"><span class="toc-text">前言</span></a></li><li class="toc-item toc-level-2"><a class="toc-link" href="#%E7%AC%AC%E4%B8%80%E7%AB%A0-ChatGLM%E3%80%81LangChain%E3%80%81Azure-OpenAI%E3%80%81%E5%90%91%E9%87%8F%E6%95%B0%E6%8D%AE%E5%BA%93%E7%9A%84%E5%9F%BA%E7%A1%80%E4%BB%8B%E7%BB%8D"><span class="toc-text">第一章 ChatGLM、LangChain、Azure OpenAI、向量数据库的基础介绍</span></a><ol class="toc-child"><li class="toc-item toc-level-3"><a class="toc-link" href="#1-1-ChatGLM3%E4%BB%8B%E7%BB%8D"><span class="toc-text">1.1 ChatGLM3介绍</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#1-2-LangChain%E4%BB%8B%E7%BB%8D"><span class="toc-text">1.2 LangChain介绍</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#1-3-Azure-OpenAI%E4%BB%8B%E7%BB%8D"><span class="toc-text">1.3 Azure OpenAI介绍</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#1-3-1-%E6%B3%A8%E5%86%8C-Azure-%E8%B4%A6%E5%8F%B7"><span class="toc-text">1.3.1 注册 Azure 账号</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#1-3-2-%E4%BF%A1%E7%94%A8%E5%8D%A1%E9%AA%8C%E8%AF%81"><span class="toc-text">1.3.2 信用卡验证</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#1-3-3-%E7%94%B3%E8%AF%B7-Azure-OpenAI-Service-%E8%AF%95%E7%94%A8"><span class="toc-text">1.3.3 申请 Azure OpenAI Service 试用</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#1-3-4-%E9%83%A8%E7%BD%B2-Azure-OpenAI-Service"><span class="toc-text">1.3.4 部署 Azure OpenAI Service</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#1-4-%E5%90%91%E9%87%8F%E6%95%B0%E6%8D%AE%E5%BA%93%E4%BB%8B%E7%BB%8D"><span class="toc-text">1.4 向量数据库介绍</span></a></li></ol></li><li class="toc-item toc-level-2"><a class="toc-link" href="#%E7%AC%AC%E4%BA%8C%E7%AB%A0-%E5%A4%A7%E5%9E%8B%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B-LLM-%E7%9A%84%E5%9F%BA%E6%9C%AC%E5%8E%9F%E7%90%86"><span class="toc-text">第二章 大型语言模型(LLM)的基本原理</span></a><ol class="toc-child"><li class="toc-item toc-level-3"><a class="toc-link" href="#2-1-%E5%88%86%E8%AF%8D%E5%99%A8"><span class="toc-text">2.1 分词器</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#2-2-%E8%AF%8D%E5%B5%8C%E5%85%A5-Word-Embedding"><span class="toc-text">2.2 词嵌入(Word Embedding)</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#2-3-%E4%BD%8D%E7%BD%AE%E7%BC%96%E7%A0%81%EF%BC%88Position-Encoding%EF%BC%89"><span class="toc-text">2.3 位置编码（Position Encoding）</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#2-4-Transformer%E6%A8%A1%E5%9E%8B"><span class="toc-text">2.4 Transformer模型</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#2-5-%E4%BB%80%E4%B9%88%E6%98%AFTransformer%E7%9A%84%E5%A4%9A%E5%A4%B4%E6%B3%A8%E6%84%8F%E5%8A%9B%E6%9C%BA%E5%88%B6%EF%BC%9F"><span class="toc-text">2.5 什么是Transformer的多头注意力机制？</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#2-6-Transformer%E7%9A%84%E6%A8%A1%E5%9E%8B%E5%88%86%E7%B1%BB"><span class="toc-text">2.6 Transformer的模型分类</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#2-6-1-%E5%BA%8F%E5%88%97%E5%88%B0%E5%BA%8F%E5%88%97%E6%A8%A1%E5%9E%8B"><span class="toc-text">2.6.1 序列到序列模型</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#2-6-2-%E5%8F%AA%E6%9C%89%E7%BC%96%E7%A0%81%E5%99%A8%E6%A8%A1%E5%9E%8B"><span class="toc-text">2.6.2 只有编码器模型</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#2-6-3-%E5%8F%AA%E6%9C%89%E8%A7%A3%E7%A0%81%E5%99%A8%E6%A8%A1%E5%9E%8B"><span class="toc-text">2.6.3 只有解码器模型</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#2-7-%E6%8F%90%E7%A4%BA%E8%AF%8D%E5%B7%A5%E7%A8%8B%E5%B8%88%E5%B7%A5%E4%BD%9C%E5%86%85%E5%AE%B9"><span class="toc-text">2.7 提示词工程师工作内容</span></a></li></ol></li><li class="toc-item toc-level-2"><a class="toc-link" href="#%E7%AC%AC%E4%B8%89%E7%AB%A0-%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E6%9C%AC%E5%9C%B0%E5%8C%96%E6%90%AD%E5%BB%BA"><span class="toc-text">第三章 大语言模型本地化搭建</span></a><ol class="toc-child"><li class="toc-item toc-level-3"><a class="toc-link" href="#3-1-ChatGLM3-6B%E9%83%A8%E7%BD%B2"><span class="toc-text">3.1 ChatGLM3-6B部署</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#3-1-1-%E7%A1%AC%E4%BB%B6%E7%8E%AF%E5%A2%83"><span class="toc-text">3.1.1 硬件环境</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#3-1-2-%E8%BD%AF%E4%BB%B6%E8%A6%81%E6%B1%82"><span class="toc-text">3.1.2 软件要求</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#3-2-ChatGLM3-6B%E4%BD%93%E9%AA%8C%E6%BC%94%E7%A4%BA"><span class="toc-text">3.2 ChatGLM3-6B体验演示</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#3-3-ChatGLM3-6B%E6%8E%A5%E5%8F%A3%E8%B0%83%E7%94%A8%E6%BC%94%E7%A4%BA"><span class="toc-text">3.3 ChatGLM3-6B接口调用演示</span></a></li></ol></li><li class="toc-item toc-level-2"><a class="toc-link" href="#%E7%AC%AC%E5%9B%9B%E7%AB%A0-%E5%90%91%E9%87%8F%E6%95%B0%E6%8D%AE%E5%BA%93ChromaDB%E4%BB%8B%E7%BB%8D"><span class="toc-text">第四章 向量数据库ChromaDB介绍</span></a><ol class="toc-child"><li class="toc-item toc-level-3"><a class="toc-link" href="#4-1-ChromaDB%E5%AE%89%E8%A3%85"><span class="toc-text">4.1 ChromaDB安装</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#4-2-%E5%87%BD%E6%95%B0%E4%BB%8B%E7%BB%8D"><span class="toc-text">4.2 函数介绍</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#4-2-1-%E5%AE%A2%E6%88%B7%E7%AB%AF%E7%B1%BB%E5%9E%8B"><span class="toc-text">4.2.1 客户端类型</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-2-2-%E5%AE%A2%E6%88%B7%E7%AB%AF%E6%96%B9%E6%B3%95"><span class="toc-text">4.2.2 客户端方法</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-2-3-%E9%9B%86%E6%88%90%E5%AF%B9%E8%B1%A1"><span class="toc-text">4.2.3 集成对象</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#4-3-%E9%9B%86%E5%90%88%E7%9A%84%E5%A2%9E%E5%88%A0%E6%94%B9%E6%9F%A5"><span class="toc-text">4.3 集合的增删改查</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#4-4-%E6%B7%BB%E5%8A%A0%E6%96%87%E6%A1%A3%E5%88%B0ChromaDB"><span class="toc-text">4.4 添加文档到ChromaDB</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#4-4-1-%E6%B7%BB%E5%8A%A0%E5%8E%9F%E5%A7%8B%E6%96%87%E6%A1%A3"><span class="toc-text">4.4.1 添加原始文档</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-4-2-%E6%B7%BB%E5%8A%A0%E6%96%87%E6%A1%A3%E5%85%B3%E8%81%94"><span class="toc-text">4.4.2 添加文档关联</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-4-3-%E6%B7%BB%E5%8A%A0%E5%B5%8C%E5%85%A5%E5%92%8C%E5%85%83%E6%95%B0%E6%8D%AE"><span class="toc-text">4.4.3 添加嵌入和元数据</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#4-5-%E6%9F%A5%E8%AF%A2%E9%9B%86%E5%90%88"><span class="toc-text">4.5 查询集合</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#4-5-1-%E6%9F%A5%E8%AF%A2%E5%B5%8C%E5%85%A5"><span class="toc-text">4.5.1 查询嵌入</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-5-2-%E6%9F%A5%E8%AF%A2%E6%96%87%E6%9C%AC"><span class="toc-text">4.5.2 查询文本</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-5-3-%E9%80%9A%E8%BF%87ID%E6%A3%80%E7%B4%A2"><span class="toc-text">4.5.3 通过ID检索</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-5-4-%E9%80%9A%E8%BF%87%E6%96%87%E6%9C%AC%E6%A3%80%E7%B4%A2%E6%95%B0%E6%8D%AE"><span class="toc-text">4.5.4 通过文本检索数据</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-5-5-%E9%80%9A%E8%BF%87%E6%9F%A5%E8%AF%A2%E6%9D%A1%E4%BB%B6%E6%A3%80%E7%B4%A2%E6%95%B0%E6%8D%AE"><span class="toc-text">4.5.5 通过查询条件检索数据</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#4-6-%E6%9B%B4%E6%96%B0%E9%9B%86%E5%90%88%E4%B8%AD%E7%9A%84%E6%95%B0%E6%8D%AE"><span class="toc-text">4.6 更新集合中的数据</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#4-6-1-%E6%9B%B4%E6%96%B0%E5%B1%9E%E6%80%A7"><span class="toc-text">4.6.1 更新属性</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-6-2-%E6%9B%B4%E6%96%B0%E6%8F%92%E5%85%A5%E6%93%8D%E4%BD%9C"><span class="toc-text">4.6.2 更新插入操作</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#4-7-%E5%88%A0%E9%99%A4%E9%9B%86%E5%90%88%E4%B8%AD%E7%9A%84%E6%95%B0%E6%8D%AE"><span class="toc-text">4.7 删除集合中的数据</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#4-7-1-%E6%8C%89ID%E5%88%A0%E9%99%A4"><span class="toc-text">4.7.1 按ID删除</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-7-2-%E6%8C%89%E6%9D%A1%E4%BB%B6%E5%88%A0%E9%99%A4"><span class="toc-text">4.7.2 按条件删除</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#4-8-%E4%BD%BF%E7%94%A8%E5%B5%8C%E5%85%A5%E5%87%BD%E6%95%B0"><span class="toc-text">4.8 使用嵌入函数</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#4-8-1-%E4%BD%BF%E7%94%A8OpenAI%E5%B5%8C%E5%85%A5%E5%87%BD%E6%95%B0"><span class="toc-text">4.8.1 使用OpenAI嵌入函数</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#4-8-2-%E8%87%AA%E5%AE%9A%E4%B9%89%E5%B5%8C%E5%85%A5%E5%87%BD%E6%95%B0"><span class="toc-text">4.8.2 自定义嵌入函数</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#4-9-%E5%90%91%E9%87%8F%E6%95%B0%E6%8D%AE%E5%BA%93%E4%B8%8Elangchain%E5%BA%94%E7%94%A8"><span class="toc-text">4.9 向量数据库与langchain应用</span></a></li></ol></li><li class="toc-item toc-level-2"><a class="toc-link" href="#%E7%AC%AC%E4%BA%94%E7%AB%A0-%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E5%BE%AE%E8%B0%83-LangChain"><span class="toc-text">第五章 大语言模型微调 - LangChain</span></a><ol class="toc-child"><li class="toc-item toc-level-3"><a class="toc-link" href="#5-1-LangChain%E5%8E%9F%E7%90%86"><span class="toc-text">5.1 LangChain原理</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#5-1-1-%E5%BE%AE%E8%B0%83%E7%9A%84%E7%9B%AE%E7%9A%84"><span class="toc-text">5.1.1 微调的目的</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#5-1-2-%E5%BE%AE%E8%B0%83%E5%B8%B8%E8%A7%81%E4%BB%BB%E5%8A%A1"><span class="toc-text">5.1.2 微调常见任务</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#5-1-3-%E5%BE%AE%E8%B0%83%E5%89%8D%E7%9A%84%E6%95%B0%E6%8D%AE%E8%A6%81%E6%B1%82"><span class="toc-text">5.1.3 微调前的数据要求</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#5-2-Langchain%E4%BB%8B%E7%BB%8D%E4%BB%A5%E5%8F%8A%E5%AE%89%E8%A3%85"><span class="toc-text">5.2 Langchain介绍以及安装</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#5-3-LangChain%E4%B8%8EChatGLM3-6B%E9%9B%86%E6%88%90"><span class="toc-text">5.3 LangChain与ChatGLM3-6B集成</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#5-4-LangChain%E4%B8%8EAzure-OpenAI%E9%9B%86%E6%88%90"><span class="toc-text">5.4 LangChain与Azure OpenAI集成</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#5-5-LangChain%E4%BE%8B%E5%AD%901-%E5%9F%BA%E7%A1%80%E4%BD%BF%E7%94%A8"><span class="toc-text">5.5 LangChain例子1 - 基础使用</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#5-6-LangChain%E4%BE%8B%E5%AD%902-%E5%86%85%E5%AD%98%E6%A3%80%E7%B4%A2"><span class="toc-text">5.6 LangChain例子2 - 内存检索</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#5-7-LangChain%E4%BE%8B%E5%AD%903-%E4%BF%A1%E6%81%AF%E6%8F%90%E5%8F%96"><span class="toc-text">5.7 LangChain例子3 - 信息提取</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#5-8-LangChain%E4%BE%8B%E5%AD%904-%E4%B8%8E%E6%95%B0%E6%8D%AE%E5%BA%93%E7%BB%93%E5%90%88"><span class="toc-text">5.8 LangChain例子4 - 与数据库结合</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#5-7-%E5%85%B6%E5%AE%83%E5%BE%AE%E8%B0%83%E6%A1%86%E6%9E%B6"><span class="toc-text">5.7 其它微调框架</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#5-7-1-lamini%E5%BE%AE%E8%B0%83%E5%B0%8F%E4%BE%8B%E5%AD%90"><span class="toc-text">5.7.1 lamini微调小例子</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#5-7-2-lamini%E8%AE%AD%E7%BB%83%E5%B0%8F%E4%BE%8B%E5%AD%90"><span class="toc-text">5.7.2 lamini训练小例子</span></a></li></ol></li></ol></li><li class="toc-item toc-level-2"><a class="toc-link" href="#%E7%AC%AC%E5%85%AD%E7%AB%A0-%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E5%BE%AE%E8%B0%83-PEFT"><span class="toc-text">第六章 大语言模型微调 - PEFT</span></a><ol class="toc-child"><li class="toc-item toc-level-3"><a class="toc-link" href="#6-1-%E6%8F%90%E7%A4%BA%E8%AF%8D%E7%9A%84%E5%B1%80%E9%99%90%E6%80%A7"><span class="toc-text">6.1 提示词的局限性</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#6-2-%E6%95%B0%E6%8D%AE%E5%87%86%E5%A4%87"><span class="toc-text">6.2 数据准备</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#6-3-%E5%BE%AE%E8%B0%83%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E5%88%86%E4%B8%BA%E4%B8%A4%E7%A7%8D%E6%96%B9%E5%BC%8F%EF%BC%9A"><span class="toc-text">6.3 微调大语言模型分为两种方式：</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#6-3-1-%E5%85%A8%E9%87%8F%E5%BE%AE%E8%B0%83"><span class="toc-text">6.3.1 全量微调</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#6-3-2-PEFT%E5%BE%AE%E8%B0%83"><span class="toc-text">6.3.2 PEFT微调</span></a></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#6-4-%E5%BE%AE%E8%B0%83%E7%9A%84%E8%BF%87%E7%A8%8B%EF%BC%9A"><span class="toc-text">6.4 微调的过程：</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#6-5-%E7%81%BE%E9%9A%BE%E6%80%A7%E9%81%97%E5%BF%98"><span class="toc-text">6.5 灾难性遗忘</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#6-6-%E6%A8%A1%E5%9E%8B%E8%AF%84%E4%BC%B0%E6%8C%87%E6%A0%87"><span class="toc-text">6.6 模型评估指标</span></a><ol class="toc-child"><li class="toc-item toc-level-4"><a class="toc-link" href="#6-6-1-%E5%87%86%E7%A1%AE%E7%8E%87%EF%BC%88Accuracy%EF%BC%89"><span class="toc-text">6.6.1 准确率（Accuracy）</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#6-6-2-%E7%B2%BE%E7%A1%AE%E7%8E%87%EF%BC%88Precision%EF%BC%89%E4%B9%9F%E7%A7%B0%E4%B8%BA%E6%9F%A5%E5%87%86%E7%8E%87"><span class="toc-text">6.6.2 精确率（Precision）也称为查准率</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#6-6-3-%E5%8F%AC%E5%9B%9E%E7%8E%87%EF%BC%88Recall%EF%BC%89%E4%B9%9F%E7%A7%B0%E4%B8%BA%E6%9F%A5%E5%85%A8%E7%8E%87"><span class="toc-text">6.6.3 召回率（Recall）也称为查全率</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#6-6-4-F1%E5%88%86%E6%95%B0%EF%BC%88F1-Score%EF%BC%89"><span class="toc-text">6.6.4 F1分数（F1-Score）</span></a></li><li class="toc-item toc-level-4"><a class="toc-link" href="#6-6-5-ROUGE%EF%BC%88Recall-Oriented-Understudy-for-Gisting-Evaluation%EF%BC%89"><span class="toc-text">6.6.5 ROUGE（Recall-Oriented Understudy for Gisting Evaluation）</span></a><ol class="toc-child"><li class="toc-item toc-level-5"><a class="toc-link" href="#ROUGE-1%E6%8C%87%E6%A0%87%E4%BE%8B%E5%AD%901%EF%BC%9A"><span class="toc-text">ROUGE-1指标例子1：</span></a></li><li class="toc-item toc-level-5"><a class="toc-link" href="#ROUGE-1%E6%8C%87%E6%A0%87%E4%BD%9C%E5%BC%8A%E4%BE%8B%E5%AD%902%EF%BC%9A"><span class="toc-text">ROUGE-1指标作弊例子2：</span></a></li><li class="toc-item toc-level-5"><a class="toc-link" href="#ROUGE-1%E6%8C%87%E6%A0%87%E5%8F%8D%E4%BD%9C%E5%BC%8A%E4%BE%8B%E5%AD%903%EF%BC%9A"><span class="toc-text">ROUGE-1指标反作弊例子3：</span></a></li><li class="toc-item toc-level-5"><a class="toc-link" href="#ROUGE-2%E6%8C%87%E6%A0%87%E4%BE%8B%E5%AD%904%EF%BC%9A"><span class="toc-text">ROUGE-2指标例子4：</span></a></li><li class="toc-item toc-level-5"><a class="toc-link" href="#ROUGE-L%E6%8C%87%E6%A0%87%E4%BE%8B%E5%AD%905"><span class="toc-text">ROUGE-L指标例子5</span></a></li></ol></li></ol></li><li class="toc-item toc-level-3"><a class="toc-link" href="#6-1-%E5%A4%A7%E5%9E%8B%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%9A%84%E8%B0%83%E4%BC%98%E6%8A%80%E5%B7%A7Fine-Tune"><span class="toc-text">6.1 大型语言模型的调优技巧Fine-Tune</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#6-2-%E5%85%A8%E9%87%8F%E5%BE%AE%E8%B0%83%E4%BB%8B%E7%BB%8D"><span class="toc-text">6.2 全量微调介绍</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#6-3-Lora%E5%BE%AE%E8%B0%83%E5%8E%9F%E7%90%86"><span class="toc-text">6.3 Lora微调原理</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#6-4-Lora%E5%BE%AE%E8%B0%83%E5%AE%9E%E9%AA%8C"><span class="toc-text">6.4 Lora微调实验</span></a></li></ol></li><li class="toc-item toc-level-2"><a class="toc-link" href="#%E7%AC%AC%E4%B8%83%E7%AB%A0-%E5%BA%94%E7%94%A8%E5%AE%9E%E8%B7%B5"><span class="toc-text">第七章 应用实践</span></a><ol class="toc-child"><li class="toc-item toc-level-3"><a class="toc-link" href="#7-1-%E9%9C%80%E6%B1%82%E5%88%86%E6%9E%90"><span class="toc-text">7.1 需求分析</span></a></li><li class="toc-item toc-level-3"><a class="toc-link" href="#7-2-%E6%9E%84%E5%BB%BA%E6%99%BA%E8%83%BD%E5%AE%A2%E6%9C%8D%E7%B3%BB%E7%BB%9F"><span class="toc-text">7.2 构建智能客服系统</span></a></li></ol></li><li class="toc-item toc-level-2"><a class="toc-link" href="#%E7%AC%AC%E5%85%AB%E7%AB%A0-%E6%80%BB%E7%BB%93"><span class="toc-text">第八章 总结</span></a></li></ol>
      
    </div>
  </div>

  
<script src="/js/catalog.js"></script>


                                        <div class="comments-container">
                                          

                                        </div>
                                        
                                  </div>
                                  

          <div id="blockchain"></div>
          <style>
            #hq {
              margin-top: 10px;
              margin-bottom: 10px;
              font-size: 18px;
            }

            #blockchain {
              margin: 0 auto;
              display: none;
              width: 590px;
              flex-direction: column;
              align-items: center;
              background: #ffffffa3;
              border-radius: 5px;
              padding: 5px 10px 10px 10px;
              margin-top: 20px;
            }

            #blockchain .htitle {
              display: flex;
              flex-direction: row;
              align-items: center;
              cursor: pointer;
            }

            #blockchain .hsubtitle {
              color: #555;
              transform: scale(0.8); /* 然后缩小至80% */
              transform-origin: 5px 12px; /* 可能需要指定缩放原点以确保准确缩放 */
            }

            #blockchain .himg {
              width: 25px;
              height: 25px;
              margin-right: 5px;
            }

            #blockchain tr, th {
              font-size: 1.7rem;
              font-weight: normal;
            }

            #blockchain tr, td {
              font-size: 1.6rem;
            }

            #blockchain tr, th, td {
              border: 1px solid #c7c7c7;
              padding: 3px 7px;
            }

            #blockchain table {
              border-collapse: collapse;
              width: 100%;
              font-size: 16px;
              font-family: arial;
            }

            @media (max-width: 800px) {
              #blockchain {
                margin: 0 auto;
                margin-top: 20px;
                display: none;
                /* justify-content: flex-start; */
                padding: 20px 10px;
                width: calc(100% - 40px);
                flex-direction: column;
                align-items: center;
              }
            }
          </style>

          
<script src="/js/axios.min.js"></script>

          <script>
            let ctoname = [
              "BTC",
              "ETH",
              "USDT",
              "BNB",
              "SOL",
              "USDC",
              "XRP",
              "DOGE",
              "ADA",
              "SHIB",
              "AVAX",
              "TRX",
              "DOT",
              "WBTC",
              "BCH",
              "LINK",
              "NEAR",
              "MATIC",
              "ICP",
              "LTC",
              "DAI",
              "UNI",
              "HBAR",
              "ETC",
              "APT",
              "FDUSD",
              "RNDR",
              "ATOM",
              "PEPE",
              "FIL"
            ];

            let ctoname2 = [
                "比特币",
                "以太坊",
                "泰达币",
                "币安币",
                "索拉纳",
                "美元硬币",
                "瑞波币",
                "狗狗币",
                "卡尔达诺",
                "柴犬币",
                "雪崩协议",
                "波场",
                "波卡",
                "包装比特币",
                "比特币现金",
                "链环",
                "近协议",
                "多边形",
                "互联网计算机",
                "莱特币",
                "戴",
                "Uniswap",
                "以太坊经典",
                "赫德拉哈希图",
                "阿普托斯",
                "第一数字美元",
                "渲染令牌",
                "佩佩",
                "宇宙",
                "文件币"
            ];

            let ctoname3 = [
                "Bitcoin",
                "Ethereum",
                "TetherUS",
                "BNB",
                "Solana",
                "USD Coin",
                "Ripple",
                "Dogecoin",
                "Cardano",
                "SHIBA INU",
                "Avalanche",
                "TRON",
                "Polkadot",
                "Wrapped Bitcoin",
                "Bitcoin Cash",
                "ChainLink",
                "NEAR Protocol",
                "Polygon",
                "Internet Computer",
                "Litecoin",
                "Dai",
                "Uniswap",
                "Ethereum Classic",
                "Hedera Hashgraph",
                "Aptos",
                "First Digital USD",
                "Render Token",
                "Pepe",
                "Cosmos",
                "Filecoin"
            ]

            let ctoname4 = [
                "比特币是一种去中心化的数字货币，它允许点对点交易，创建于2009年。",
                "以太坊是一个开源的区块链平台，支持智能合约和去中心化应用，推出于2015年。",
                "泰达币是一种与美元挂钩的稳定币，旨在保持1:1的美元价值。",
                "币安币是币安交易所发行的加密货币，用于支付交易费用和其他服务。",
                "索拉纳是一个高性能区块链平台，旨在提供快速、安全和可扩展的去中心化应用。",
                "USD Coin是一种与美元挂钩的稳定币，由Circle和Coinbase合作推出。",
                "瑞波币是一种由Ripple公司创建的加密货币，旨在促进银行间快速、低成本的跨境支付。",
                "狗狗币是一种基于模因的加密货币，起初作为玩笑创建，但后来因社区支持而流行。",
                "卡尔达诺是一个第三代区块链平台，致力于提供可持续和可扩展的去中心化应用。",
                "柴犬币是一种模仿狗狗币的加密货币，以其社区驱动的发展模式和广泛的在线社区而闻名。",
                "雪崩币是Avalanche区块链平台的原生代币，支持去中心化应用和金融资产。",
                "波场币是波场区块链的原生代币，旨在为数字娱乐产业提供去中心化的内容分享平台。",
                "波卡币是一个多链区块链平台，旨在实现不同区块链之间的互操作性。",
                "包装比特币是比特币在以太坊区块链上的代币化版本，使其能够用于DeFi应用。",
                "比特币现金是比特币的一个分叉，旨在通过增加区块大小来实现更快的交易速度。",
                "Chainlink是一个去中心化的预言机网络，旨在连接智能合约和现实世界的数据。",
                "近邻协议是一个高性能区块链，致力于提供去中心化应用的理想开发平台。",
                "Polygon是一个以太坊扩展解决方案，旨在提供快速、低成本的交易。",
                "Internet Computer是一个去中心化的区块链网络，旨在扩展互联网功能。",
                "莱特币是一种基于比特币协议的加密货币，具有更快的区块生成时间。",
                "Dai是一种由MakerDAO创建的去中心化稳定币，与美元挂钩。",
                "Uniswap是一个基于以太坊的去中心化交易所，允许用户进行代币交换。",
                "Hedera是一个去中心化的公有账本，使用哈希图共识算法。",
                "以太经典是以太坊的一个分叉，保持了原始以太坊链的历史记录。",
                "Aptos是一个新兴的区块链平台，旨在提供高效、安全的去中心化应用。",
                "First Digital USD是一种与美元挂钩的稳定币，旨在提供数字美元的替代方案。",
                "Render Token是一个分布式的GPU渲染网络，旨在提供高效的渲染服务。",
                "宇宙链是一个区块链网络，旨在实现不同区块链之间的互操作性。",
                "Pepe是一种模仿柴犬币的加密货币，以其社区驱动的发展模式而著名。",
                "文件币是一个去中心化的存储网络，旨在利用区块链技术提供安全的数据存储。"
            ];

            async function requestBlockChain() {
              const instance = axios.get("/blockchain")
              let jsonData = (await instance).data

              let table = `<h2 id='hq'>虚拟货币行情</h2>
                <div style="font-size: 1.5rem; font-weight: normal; padding: 0px 0px 10px 0px;">(美元对人民币汇率：${jsonData['exchange']})</div>
                <table border='1'>
                  <tr>
                    <th width="40%">虚拟货币</th>
                    <th width="30%">价格(人民币)</th>
                    <th width="30%">价格(美元)</th>
                  </tr>`;
              
              for (let i = 0; i <= 20; i++) {
                if (!jsonData['list'][ctoname[i]]) {
                  continue;
                }

                let rmb = Math.round(jsonData['list'][ctoname[i]] * jsonData['exchange'] * 100000) / 100000;
                let usd = jsonData['list'][ctoname[i]]

                table += `
                <tr>
                  <td>
                    <div class="htitle" title="${ctoname4[i]}">
                      <img class="himg" src="/images/BlockChain/${ctoname[i]}.jpg" />
                      ${ctoname[i]}
                      <span class="hsubtitle">
                        (${ctoname2[i]})
                      </span>
                    </div>
                  </td>
                  <td>${rmb}</td>
                  <td>${usd}</td>
                </tr>`;
              }

              // for (let currency in jsonData) {
              //   table += `<tr><td>${ctoname[currency].name}</td><td>${jsonData[currency]}</td></tr>`;
              // }
              table += "</table>";

              document.getElementById("blockchain").innerHTML = table;
              document.getElementById("blockchain").style.display = "flex"
            }

            requestBlockChain()
          </script>

          
<div class="footer">
  <div class="social">
    <ul>
      
        <li>
          <a title="github" href="">
            <i class="iconfont icon-"></i>
          </a>
        </li>
      
        <li>
          <a title="wechat" href="">
            <i class="iconfont icon-wechat"></i>
          </a>
        </li>
      
    </ul>
  </div>
  
    
    <div class="footer-more">
      
        <a target="_blank" rel="noopener" href="https://github.com/zchengsite/hexo-theme-oranges">Copyright © 2024 lijunjie</a>
        
    </div>
  
    
    <div class="footer-more">
      
        <a href="https://hahaha.love">Theme by Oranges | Powered by Lijunjie</a>
        
    </div>
  
  
</div>


<script async src="/plugins/consolevideo.js"></script>
        </div>

        <div class="tools-bar">
          <div class="back-to-top tools-bar-item hidden">
  <a href="javascript: void(0)">
    <i class="iconfont icon-chevronup"></i>
  </a>
</div>


<script src="/js/backtotop.js"></script>


  <div class="search-icon tools-bar-item" id="search-icon">
    <a href="javascript: void(0)">
      <i class="iconfont icon-search"></i>
    </a>
  </div>

  <div class="search-overlay hidden">
    <div class="search-content" tabindex="0">
      <div class="search-title">
        <span class="search-icon-input">
          <a href="javascript: void(0)">
            <i class="iconfont icon-search"></i>
          </a>
        </span>
        
          <input type="text" class="search-input" id="search-input" placeholder="搜索...">
        
        <span class="search-close-icon" id="search-close-icon">
          <a href="javascript: void(0)">
            <i class="iconfont icon-close"></i>
          </a>
        </span>
      </div>
      <div class="search-result" id="search-result"></div>
    </div>
  </div>

  <script type="text/javascript">
    var inputArea = document.querySelector("#search-input")
    var searchOverlayArea = document.querySelector(".search-overlay")

    inputArea.onclick = function() {
      getSearchFile()
      this.onclick = null
    }

    inputArea.onkeydown = function() {
      if(event.keyCode == 13)
        return false
    }

    function openOrHideSearchContent() {
      let isHidden = searchOverlayArea.classList.contains('hidden')
      if (isHidden) {
        searchOverlayArea.classList.remove('hidden')
        document.body.classList.add('hidden')
        // inputArea.focus()
      } else {
        searchOverlayArea.classList.add('hidden')
        document.body.classList.remove('hidden')
      }
    }

    function blurSearchContent(e) {
      if (e.target === searchOverlayArea) {
        openOrHideSearchContent()
      }
    }

    document.querySelector("#search-icon").addEventListener("click", openOrHideSearchContent, false)
    document.querySelector("#search-close-icon").addEventListener("click", openOrHideSearchContent, false)
    searchOverlayArea.addEventListener("click", blurSearchContent, false)

    var searchFunc = function (path, search_id, content_id) {
      'use strict';
      var $input = document.getElementById(search_id);
      var $resultContent = document.getElementById(content_id);
      $resultContent.innerHTML = "<ul><span class='local-search-empty'>首次搜索，正在载入索引文件，请稍后……<span></ul>";
      $.ajax({
        // 0x01. load xml file
        url: path,
        dataType: "xml",
        success: function (xmlResponse) {
          // 0x02. parse xml file
          var datas = $("entry", xmlResponse).map(function () {
            return {
              title: $("title", this).text(),
              content: $("content", this).text(),
              url: $("url", this).text()
            };
          }).get();
          $resultContent.innerHTML = "";

          $input.addEventListener('input', function () {
            // 0x03. parse query to keywords list
            var str = '<ul class=\"search-result-list\">';
            var keywords = this.value.trim().toLowerCase().split(/[\s\-]+/);
            $resultContent.innerHTML = "";
            if (this.value.trim().length <= 0) {
              return;
            }
            // 0x04. perform local searching
            datas.forEach(function (data) {
              var isMatch = true;
              var content_index = [];
              if (!data.title || data.title.trim() === '') {
                data.title = "Untitled";
              }
              var orig_data_title = data.title.trim();
              var data_title = orig_data_title.toLowerCase();
              var orig_data_content = data.content.trim().replace(/<[^>]+>/g, "");
              var data_content = orig_data_content.toLowerCase();
              var data_url = data.url;
              var index_title = -1;
              var index_content = -1;
              var first_occur = -1;
              // only match artiles with not empty contents
              if (data_content !== '') {
                keywords.forEach(function (keyword, i) {
                  index_title = data_title.indexOf(keyword);
                  index_content = data_content.indexOf(keyword);

                  if (index_title < 0 && index_content < 0) {
                    isMatch = false;
                  } else {
                    if (index_content < 0) {
                      index_content = 0;
                    }
                    if (i == 0) {
                      first_occur = index_content;
                    }
                    // content_index.push({index_content:index_content, keyword_len:keyword_len});
                  }
                });
              } else {
                isMatch = false;
              }
              // 0x05. show search results
              if (isMatch) {
                str += "<li><a href='" + data_url + "' class='search-result-title'>" + orig_data_title + "</a>";
                var content = orig_data_content;
                if (first_occur >= 0) {
                  // cut out 100 characters
                  var start = first_occur - 20;
                  var end = first_occur + 80;

                  if (start < 0) {
                    start = 0;
                  }

                  if (start == 0) {
                    end = 100;
                  }

                  if (end > content.length) {
                    end = content.length;
                  }

                  var match_content = content.substr(start, end);

                  // highlight all keywords
                  keywords.forEach(function (keyword) {
                    var regS = new RegExp(keyword, "gi");
                    match_content = match_content.replace(regS, "<span class=\"search-keyword\">" + keyword + "</span>");
                  });

                  str += "<p class=\"search-result-abstract\">" + match_content + "...</p>"
                }
                str += "</li>";
              }
            });
            str += "</ul>";
            if (str.indexOf('<li>') === -1) {
              return $resultContent.innerHTML = "<ul><span class='local-search-empty'>没有找到内容，请尝试更换检索词。<span></ul>";
            }
            $resultContent.innerHTML = str;
          });
        },
        error: function(xhr, status, error) {
          $resultContent.innerHTML = ""
          if (xhr.status === 404) {
            $resultContent.innerHTML = "<ul><span class='local-search-empty'>未找到search.xml文件，具体请参考：<a href='https://github.com/zchengsite/hexo-theme-oranges#configuration' target='_black'>configuration</a><span></ul>";
          } else {
            $resultContent.innerHTML = "<ul><span class='local-search-empty'>请求失败，尝试重新刷新页面或稍后重试。<span></ul>";
          }
        }
      });
      $(document).on('click', '#search-close-icon', function() {
        $('#search-input').val('');
        $('#search-result').html('');
      });
    }

    var getSearchFile = function() {
        var path = "/search.xml";
        searchFunc(path, 'search-input', 'search-result');
    }
  </script>


        </div>
    </div>

  </body>

</html>