52 www.52nlp.cn / 2019-01-01 20:13 / by @技术头条 / 原作者：@52nlp

理论 | 朴素贝叶斯模型算法研究与实例分析

朴素贝叶斯模型是机器学习常用的模型算法之一，其在文本分类方面简单易行，且取得不错的分类效果。所以很受欢迎，对于朴素贝叶斯的学习，本文首先介绍理论知识即朴素贝叶斯相关概念和公式推导，为了加深理解，采用一个维基百科上面性别分类例子进行形式化描述。然后通过编程实现朴素贝叶斯分类算法，并在屏蔽社区言论、垃圾邮件、个人广告中获取区域倾向等几个方面进行应用，包括创建数据集、数据预处理、词集模型和词袋模型、朴素贝叶斯模型训练和优化等。然后结合复旦大学新闻语料进行朴素贝叶斯的应用。最后，大家熟悉其原理和实现之后，采用机器学习sklearn包进行实现和优化。由于篇幅较长，采用理论理解、案例实现、sklearn优化三个部分进行学习。

赞过的人

@技术头条

ix ixyzero.com / 2025-01-12 12:07

和舞弊有关的理论及研究

本文介绍了舞弊的定义及其对企业的危害，重点阐述了舞弊的主要理论，包括冰山理论、三角理论、GONE理论和舞弊风险因子理论。此外，文章讨论了我国舞弊案件中出现的“29岁现象”，即舞弊者年龄集中在29岁左右的趋势，并分析了其成因，提出了综合治理的建议。该内容适合企业管理者、审计人员、风险控制专家以及对企业舞弊防范感兴趣的研究人员阅读。

查看详情

无图

bl blog.devtang.com / 2025-01-12 11:55

CSPJ 教学思考：贪心算法

本文介绍了贪心算法在 CSP-J（信息学奥林匹克联赛入门级）教学中的应用。贪心算法通过每一步选择局部最优解，期望最终达到全局最优。作者强调了排序在贪心算法中的重要性，并提供了 sort 函数和自定义结构体排序的示例代码。文章还推荐了适合教学的题目，如 P2240 部分背包问题、P1223 排队接水等，并附上详细的解题思路和代码实现。适合正在备战 CSP-J 的学生和指导教师参考。

查看详情

无图

te tech.meituan.com / 2024-11-02 16:18

新一代实验分析引擎：驱动履约平台的数据决策

本文介绍了美团履约技术平台的新一代实验分析引擎，该引擎对核心实验框架进行了标准化，并融合了众多先进解决方案，有效解决小样本挑战。同时，提供了多样化的溢出效应应对策略，并针对不同业务场景提供了精准的方差和P值计算方法，以规避统计误差。希望对大家有所帮助或启发。

查看详情

无图

co www.codedump.info / 2024-09-09 23:46

图解Blink-Tree：B+Tree的一种并发优化结构和算法

本文介绍了 Blink-Tree，这是一种 B+Tree 的并发优化结构。通过引入 high key 和 link 指针，解决了并发访问时的性能问题，特别适用于高并发环境的存储引擎优化。如果你对数据库存储引擎感兴趣，这篇文章不容错过！

查看详情

无图

hu hubojing.github.io / 2024-08-06 08:12

【大模型系列】指令微调

本文总结了大模型中的指令微调（Instruction Tuning）技术，重点介绍了如何通过指令化数据对大语言模型进行参数微调以提升任务性能。文章探讨了数据构建方法如Self-Instruct和Evol-Instruct，以及微调策略包括优化设置和高效微调方法。通过这些技术，模型可以在多任务场景中表现出色。此内容对希望提升大语言模型能力的研究者和开发者具有参考价值。

查看详情

无图

hu hubojing.github.io / 2024-08-06 08:11

【大模型系列】提示学习

本文介绍了提示学习（Prompt Learning）的基础概念和应用场景。作者详细讨论了提示学习在大语言模型中的作用，以及如何通过优化提示来提高模型的任务表现。文章还分享了在实际应用中调整和设计提示的技巧，并探讨了该技术在自然语言处理中的未来发展趋势。这篇文章为希望利用大模型进行高效自然语言处理的开发者提供了有价值的见解。

查看详情

无图

bl blog.codingnow.com / 2024-05-05 23:26

大批量动画模型的优化

最近和公司一个开发团队探讨了一下他们正在开发的游戏中遇到的性能问题，看看应该如何优化。这个游戏的战斗场景想模仿亿万僵尸(They are billions）的场景。在亿万僵尸中，场景中描绘了上万的僵尸潮，但我们这个游戏，超过 500 个僵尸就遇到了性能问题。固然，手机的硬件性能比不上 PC ，但 500 这个数量级还是略低于预期。

对于游戏中大量类似的动画物体，肯定有方法可以优化。

查看详情

无图

te tech.meituan.com / 2024-03-31 21:14