IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:Streaming

共 2 篇相关文章

IT 累计浏览 2,306

视频的容器与格式

这篇梳理视频格式领域的基础文章,从“编码”与“容器”两个核心维度展开。作者将视频编码(如H.264、H.265)比作内容的“压缩标准”,决定了画面质量与文件大小;而容器(如MP4、MKV)则是装载这些内容的“打包盒子”。文章依次介绍了从经典的MPEG-1/2到目前主流的H.264、代表趋势的H.265等编码技术的演进与特点,并对比了MOV、AVI、MKV等主流容器的优劣——例如MKV因其超强的包容性而被称为“万能容器”,能封装几乎任何格式的音视频流。 对于需要处理或选择视频格式的开发者、创作者而言,文章提供了清晰的脉络:H.264+MP4是当下兼容性最广的选择,而H.265则代表了在同等画质下更高效压缩的未来方向。无论是理解DVDRip中的MPEG-2,还是分辨RMVB文件背后的RealVideo编码,这篇文章都给出了直观的解答。

IT 累计浏览 4,394

几个HIVE的streaming

作者分享了在实际项目(JIS旺铺装修数据开发)中,因Hive原生功能不足而编写四个Python Streaming的实战案例。每个案例都针对一个具体的数据处理痛点,提供了可直接复用或修改的代码示例。 文章逐一拆解了这四个脚本的核心逻辑:前两个用于处理流式数据中的“前序”与“后序”输出,基于分组和特定标志位(flag)进行行级过滤;第三个实现了十进制到三十六进制的转换函数;第四个则相对复杂,处理行内字段拼接与跨行分组聚合,并包含了时间戳格式化等细节。 这些实现的关键在于巧妙地利用了Streaming脚本对标准输入的逐行处理能力,通过维护状态(如前序ID、分组标识)来完成Hive SQL较难表达的序列逻辑。代码虽短,却展现了将复杂数据操作拆解为流式处理步骤的清晰思路,对于有类似数据清洗、序列归并需求的开发者很有参考价值。