Ansible_详细用法部署安装--技术头条 -- 微博大V帮你宣传技术博文开发者头条码农头条

由 @暖夏未眠丶 2017-05-25 14:00 / 0个评论

使用 llama.cpp 在本地部署 AI 大模型的一次尝试 (blog.yuanpei.me)

本文旨在尝试使用 llama.cpp 在本地部署 AI 大模型，随着人工智能的快速发展，我们逐渐认识到私有化部署的重要性和潜力。在此背景下，llama.cpp 作为一个纯 C/C++ 实现的 LLaMA 模型推理工具，提供了在本地环境下高性能的 AI 推理能力。在这篇文章中，我们可以了解到 llama.cpp 具有在 GPU 和 CPU 环境下运行的灵活性，满足私有化部署的需求。文章详细介绍了 llama.cpp 编译和部署的过程，为读者提供了一份在本地部署 AI 大模型的教程。私有化部署的 AI 大模型，相比于 ChatGPT 这类通用大模型，更注重数据隐私和安全性，对云服务的依赖更少，可以做到更好的本地化控制。虽然编译 llama.cpp 有一定的复杂性，AI 大模型的下载、转化、量化需要一定的耐心，可当本地的 AI 应用运行起来的那一刻，博主觉得这一切完全值得。

by @技术头条 2024-03-12 22:29 查看详情

美团RASP大规模研发部署实践总结 (tech.meituan.com)

RASP是Runtime Application Self-Protection（运行时应用自我保护）的缩写，是一种应用程序安全技术。RASP 技术能够在应用程序运行时检测并阻止应用级别的攻击。随着云计算和大数据的发展，应用程序安全越来越受到重视。RASP 技术作为一种新型的安全防护手段，正在逐渐被业界接受并广泛应用。

by @技术头条 2024-01-28 23:48 查看详情

美团RASP大规模研发部署实践总结 (www.cnxct.com)

RASP是Runtime Application Self-Protection（运行时应用自我保护）的缩写，是一种应用程序安全技术。RASP 技术能够在应用程序运行时检测并阻止应用级别的攻击。随着云计算和大数据的发展，应用程序安全越来越受到重视。RASP 技术作为一种新型的安全防护手段，正在逐渐被业界接受并广泛应用。其中Java RASP 是一种针对 Java 应用程序的 RASP 技术。通过在 Java 虚拟机（JVM）级别进行监控和防护，能够有效防止对 Java 应用程序的攻击。

by @技术头条 2024-01-17 23:15 查看详情

算法部署从docker到K8s (yance.wiki)

最近需要做一次面向公司的算法团队的k8s培训，算法的同事对于docker和gpu的使用还是比较熟悉的，随着大模型的发展，很多训练、测试、数据处理的任务都需要在k8s上进行，所以需要对k8s有一个基本的了解，基于这样的背景，我结合docker的使用，对k8s的一些概念进行了类

by @技术头条 2023-09-10 23:17 查看详情

容器与云，分步指南：安装和访问 Kubernetes 仪表板 (linux.cn)

Kubernetes 是一个开源容器编排平台，已成为大规模管理容器化应用的首选解决方案。虽然 Kubernetes 提供了强大的命令行工具来管理集群，但有时可视化界面可以使监控和管理部署变得更加容易。Kubernetes 仪表板是一个基于 Web 的用户界面，可让你可视化 Kubernetes 集群并与之交互。

在这篇博文中，我们将逐步引导你完成安装和访问 Kubernetes Dashboard 的过程，使你能够简化 Kubernetes 管理任务。

by @技术头条 2023-08-07 23:27 查看详情

在一些轻量化的场景之中，使用 ELK 方案来解决日志问题就会比较笨重，素闻 Loki 比较香，今天折腾了一番，特此记录一下整个流程。本文不涉及 Loki 的深度使用与研究，但是参照本文，你可以快速把 Loki 拉起来，并且把 Nginx 日志正确采集进来。

by @技术头条 2023-06-05 23:53 查看详情

如何在 Arch Linux 中安装 GNOME 桌面 (linux.cn)

本指南解释了在 Arch Linux 中安装 GNOME 桌面所需的步骤。

本指南有两部分：第一部分是关于安装基本的 Arch 系统；第二部分是在 Arch Linux 基础上安装完整的 GNOME 桌面环境。

by @技术头条 2023-02-16 00:18 查看详情

美团视觉GPU推理服务部署架构优化实践 (tech.meituan.com)

面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战，美团视觉研发团队决定通过模型结构拆分和微服务化进行优化，他们提出一种通用高效的部署架构，来解决这种常见的性能瓶颈问题。以“图像检测+分类”服务为例，优化后的服务压测性能指标GPU利用率由40%提升至100%，QPS也提升超过3倍。本文将会重点介绍推理服务部署架构优化的工程实践，希望对大家能有所帮助或启发。

by @技术头条 2023-02-12 14:37 查看详情

快速构建和安装干净的 ESXi 8 镜像指南 (soulteary.com)

申请的 ESXi 8 的免费授权到了，所以趁着春节假期最后一天，折腾一把。这篇文档支持 ESXi 8 及以下版本的安装镜像构建，无需麻烦的依赖安装和解决环境问题。相比较安装运行网上已经构建好的黑盒镜像，为什么不自己进行构建呢？

by @技术头条 2023-02-12 14:06 查看详情

部署机器学习方案之困（下） (blog.nsfocus.net)

在工业环境中开发基于机器学习的解决方案包括四个阶段：数据管理、模型学习、模型验证和模型部署，而这些阶段没有严格的时间轴，在一定程度上存在并行和反馈循环。本节将讨论从业者在最后一个阶段中面临的常见问题和挑战，并讨论涉及到的其他问题。

by @技术头条 2023-02-12 14:05 查看详情