winkz

BERT会说话吗?

一个想法 以GPT为代表的自回归预训练语言模型有着惊人的文本补全能力。这种通用能力来自它的预训练任务Next Token Predict,即下一词预测任务。那BERT能做到这样的事吗?众所周知,BERT的预训练任务是MLM(完形填空)和NSP(下一句预测),这种预训练任务和NTP不同,可能无法做生成

vue-cli迁移Vite实战

动机 Vite: 快速冷启动 即时热模块替换 生产环境优化 10x以上的性能优化 最主要的原因还是因为Vite热编译速度快,而且随着vite来到了5.x版本,已经可以作为生产版本,遂准备升级。 流程 修改package.json 删除vue-cli相关插件: # 删除vue-cli 相关插件

Java多线程学习记录(二)

读写锁 伪代码 一个通用的读写锁的伪代码如下所示 count_mutex = mutex_init(); write_mutex = mutex_init(); read_count = 0; void read_lock { lock(count_mutex); read_count++;

Java多线程学习记录(一)

多线程实现方法 对于JDK21之前的JAVA来说(未实现协程),主要通过以下三种办法实现多线程 继承Thread类并重写run方法 实现Runable接口 实现Callable接口 写法分别为以下三种: class ThreadA extends Thread { @Over

h-index计算解法

leetcode 274: 给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数。计算并返回该研究者的 h 指数。 根据维基百科上 h 指数的定义:h 代表“高引用次数” ,一名科研人员的 h 指数 是指他(她)至少发表了 h 篇论文,并且

回溯解法

前言 回溯问题的本质实际上还是树的遍历。 回溯法一般是在集合中递归搜索,集合的大小构成了树的宽度,递归的深度构成的树的深度,下面的图来自代码随想录: 那如何回溯呢?就比如说,图中的递归问题遍历到了第三层第一个元素,我们知道在第一层和第二层已经选择过的决策中,还有其他决策(兄弟节点)可以选择,那么就将

长度最小的子数组题解

题目 209. 长度最小的子数组 给定一个含有 n 个正整数的数组和一个正整数 target 。 找出该数组中满足其总和大于等于

LEETCODE.3题解

题目 给定一个字符串 s ,请你找出其中不含有重复字符的 最长 子串 的长度。 示例 1: 输入: s = "abcabcbb" 输出: 3 解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。 示例 2: 输入: s = "bbbbb" 输出: 1 解释: 因为无重复字符的最长子

NLP中的ATTENTION_MASK通常的作用是什么?

在Transformer模型中,注意力机制在编码和解码过程中起着至关重要的作用,而填充掩码(Pad Mask)则用于确保这些注意力机制正确处理输入序列中的无效或填充(PAD)标记。避免了Decoder在生成预测时错误地将注意力集中在这些无关的填充标记上。 填充掩码(通常称为Attention Pad

LEETCODE 31.下一个排列问题

题目 整数数组的一个 排列 就是将其所有成员以序列或线性顺序排列。 例如,arr = [1,2,3] ,以下这些都可以视作 arr 的排列:[1,2,3]、[1,3,2]、[3,1,2]、[2,3,1] 。 整数数组的 下一个排列 是指其整数的下一个字典序更大的排列。更正式地,如果数组的所有排列根据