MaxCompute技术人背后的故事:从ApacheORC到AliORC (yq.aliyun.com)

【简介】

2019大数据技术公开课第一季《技术人生专访》来袭,本季将带领开发者们探讨大数据技术,分享不同国家的工作体验。本文整理自阿里巴巴计算平台事业部高级技术专家吴刚的专访,将为大家介绍Apache ORC开源项目、主流的开源列存格式ORC和Parquet的区别以及MaxCompute选择ORC的原因。此外,吴还将分享他是如何一步步成为Apache开源项目的Committer和PMC的。

点击查看原文 >>

@可耐芊小仙女 2019-07-25 16:41 / 0个评论
赞过的人: @技术头条
要不要再学学下面的文章?
容器技术驱动下的代码沙箱实践与思考 (blog.yuanpei.me)
本文探讨了基于容器技术的代码沙箱应用,旨在隔离代码执行环境,提升安全性和稳定性。通过 Docker 容器创建语言镜像,支持多语言代码执行。文章介绍了使用 Jupyter 实现代码可视化,并借助 nbformat 和 nbconvert 管理和执行 Jupyter 笔记本,增强代码展示效果。此方案不仅提高了开发灵活性,还便于在 AI 编程中实时展示和分析结果。
by @技术头条 2024-11-02 16:40 查看详情
OpenTelemetry在企业内部应用所需要的技术栈 (crossoverjie.top)
本文详细解析了 OpenTelemetry 在企业中的技术栈应用,涵盖日志、指标和链路追踪的整合方案,帮助实现系统全方位的可观测性。介绍了 OpenTelemetry 的架构和关键组件如 Collector、eBPF,以及 SigNoz 和 OpenObserve 等开源工具,以实现统一的数据存储和可视化,适合需要高效、灵活监控的企业部署。
by @技术头条 2024-11-02 16:35 查看详情
搜索广告召回技术在美团的实践 (tech.meituan.com)
美团通过生成式关键词召回和多模态向量检索技术,大幅提升了搜索广告的召回效率。本文详细介绍了生成式大模型在广告召回中的实践,特别是结合扩散模型的多模态优化,适合关注广告技术和 AI 应用的读者。
by @技术头条 2024-09-09 23:47 查看详情
信息流广告预估技术在美团外卖的实践 (tech.meituan.com)
信息流广告的精准预估技术是提升外卖业务广告效果的关键。美团外卖通过深度模型优化,实现了从用户行为建模到长短期兴趣匹配的全面升级,提升广告点击率。本文详细解析了信息流广告背后的技术架构和实践经验,适合所有关注广告优化的技术爱好者。想了解美团如何高效提升广告预估准确率吗?
by @技术头条 2024-09-08 23:29 查看详情
对“技术质问产品的几个常见问题”的回答 (blog.csdn.net)
给某大厂的技术新人做了一个关于产品思维的分享,提前收集了一些困惑,贴几条提及最多的,稍微聊一下。

哦对了,先帮产品说句话——技术同学,千万别简单地用“那个产品是傻X”来回答以下问题。这是因为,作为技术,如果你总觉得和你配合的产品都是傻X,那大概率,别人会觉得你也是——要不然,为什么选择与傻X共事?所谓 “若,我看周围皆傻X,料,世人看我亦如是”。
by @技术头条 2024-05-05 23:33 查看详情
现代Python CRUD技术栈 (farer.org)
作为一名资深Python CRUD boy,在今天用flask和django干这些体力活已经稍显过时,flask这些年来功能并没太大进步,想用什么还是得自己折腾,在工程化方面比较考验开发者的个人素养。而django的虽然功能完善,但它的笨重在需要深度定制时,又显得束手束脚。
by @技术头条 2024-05-05 23:18 查看详情
周刊(第8期):技术配图的一些心得 (www.codedump.info)
简单总结了一下个人技术配图的一些心得,总的大原则是:
1、区分:将组件、流程、趋势等之间的”区分“尽可能在图示中通过各种手段(如不同的颜色、形状、箭头)表达出来。
2、联系:组件之间的数据流动、状态切换等,都是它们之间的联系,也需要通过各种手段表达出来。
3、说明:可能的话,要在图中加上一些说明文字,如步骤说明、分类说明,等等。
by @技术头条 2024-03-31 21:06 查看详情
聊聊 Go 的边界检查消除技术 (colobu.com)
在翻译的从慢速到SIMD一文中, SourceGraph工程师其中的一个优化就是边界检查消除(BCE,bounds check elimination)技术,同时他也抛给了读者一个问题:

为啥在使用 a[i:i+4:i+4] 而不是 a[i:i+4]?

本文第一部分先回答这个问题。 第二部分介绍更好的边界检查消除方法。 第三部分再全面梳理Go的边界检查消除技术。
by @技术头条 2024-03-21 23:00 查看详情
32 位的操作系统也能使用超过4G的内存-PAE 技术简介 (www.addesp.com)
阅读本文章前请确认对X86下的分页机制有最基本的了解,否则将难以理解本文中提到的内容。本文介绍的内容均位X86架构下的PAE技术,而不是ARM架构下的LPAE技术,虽然两者从本质来说是一样的。
by @技术头条 2023-11-06 23:32 查看详情
技术 | Btrfs 详解:快照 (linux.cn)
想象一下,你长时间处理一个文件,反复添加和撤销修改。然后,在某个时刻你意识到:两小时前你撤销的部分修改,现在会非常有用。而昨天在你销毁那个设计之前,你也已经修改了这个特殊的部分。当然,由于你会定期保存文件,所以旧的改动会丢失。很多人可能都遇到过这样的情况。如果能恢复旧版本的文件,而无需定期手动复制,岂不美哉?

这是一个 Btrfs 快照可以帮助你的特别场景。当你使用正确的话,快照同时也为你的电脑提供了很好的备份方案。
by @技术头条 2023-10-24 23:57 查看详情