什么是Embedding? 在学习嵌入模型之前,我们需要先了解什么是Embedding。简单来说,Embedding是一种将离散的非结构化数据(如文本中的单词、句子或文档)转换为连续向量的技术。 在自然语言处理(NLP)领域,Embedding通常用于将文本映射为固定长度的实数向量,以便计算机能够更好地处理和理解这些数据。每个单词或句子都可以用一个…
智能知识库构建指南:向量模型、文本大模型与Elasticsearch多路召回的实战技术解析 近期小鹿的项目组在研究RAG(检索增强生成)技术的应用与实战,小鹿在上一篇文章中提到了RAG技术的一些基本概念,而这篇文章小鹿主要是想记录一下从零到有完成一个基本的RAG开发流程,文章中的代码语言选择是Java,基于langchain4j框架。 什么是向量模…
【科普】大模型中的Temperature和Top P原理详解 大家可能在使用AI第三方工具的时候,看到以下这两个参数:Temperature和Top P,或许看网上各种关于他们的解释可以初步知道他们和随机性有关,但是不知道其具体原理,所以小鹿在这里以通俗的语言给大家详细解释一下。 第三方模型参数图示例: 在读这篇文章之前,我假设你已经知道了大模型的…
小鹿想学习一下什么是RAG,国内回答通常来说也是一知半解,因为完全落地的还不是很多。但是小鹿在aws官网看到一篇文章,我觉得讲的很是通俗易懂,所以转发一下,原文地址点这里 什么是检索增强生成? 检索增强生成(RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练,使用…
优雅的解决Vue+ElementUI项目中的分页勾选问题 小鹿最近的项目中涉及到很多表格的操作,我去看了一下el-table的文档解释,官方组件似乎并不支持分页勾选,但是项目又需要这个效果,所以小鹿就干脆自己写了一个公共组件,记录一下,方便后期使用。 业务场景 所谓分页勾选就是说,用户在表格中勾选了一条数据,当切换到第二页的时候,再勾选某些数据,这…
WebStorm 配置Prettier 配置.prettierrc自动格式化代码 最近小鹿开始从vscode转到使用WebStorm进行前端开发,主要是觉得WebStorm的强大功能以及界面更让小鹿感觉到舒服,但是我用了半天后发现小鹿写的代码居然都没有进行格式化。网上找了很多方案(尤其是CSDN)也都是复制粘贴的一堆没用的方案,不过最终小鹿还是找到…
安装nvm 首先先检查是否已经安装nvm nvm --version 如果未安装nvm,可以使用brew方式安装 brew install nvm 确定环境变量生效 如果安装成功后依旧是没有找到nvm命令,则需要修改一下环境变量,小鹿都是M芯片所以在这里写的是M芯片内容 vim ~/.zshrc # 如果你使用的是brew 安装的的nvm方式 填入…
小鹿最近买了一张GiffGaff卡,然后将一些注意事项记录下来以供查询使用 Giffgaff 简介 Giffgaff 是一家位于英国的电信公司,成立于2009年11月25日,是 O2 的全资子公司。作为一家移动虚拟网络运营商,它使用 O2 的网络服务。Giffgaff 的独特之处在于其社区运营模式,用户可以参与公司的运营,包括销售、客服和市场营销等…
假如你有两台服务器,A和B。A速度很快,但是不能观看Netflix,B你使用起来很慢却可以观看Netflix,而从A访问B却很快,那么如何用A服务器的速度去用B访问Netflix呢? 安装: 在支持Netflix的B服务器上面安装Dnsmasq & Sniproxy需要占用B服务器80和53端口 wget --no-check-cert…
因为如果是从官方下载的Ubuntu原生系统,通常默认是不允许使用root用户进行SSH登录的,所以在这里需要进行配置,打开root用户的密码登录权限。 首先打开"终端窗口",输入 sudo apt-get update "-->回车-->"输入当前登录用户的管理员密码"-->回车,…