干趴面试官系列 | 请你简述一下Kafka中的分区分配 (mp.weixin.qq.com)

【简介】

“请你简述一下Kafka中的分区分配”,当面试官问你这个问题的时候,你会怎么回答?其实,这道题目里面就暗藏汹涌,因为Kafka中的分区分配在多处出现,而这个问题的表述方式是在潜意识里暗示你回答一种,这样在你自认为很完美的回答完这个问题之后,面试官会冷不丁的来一句:还有呢?

点击查看全文 >>

@zhisheng_tian 2019-06-29 13:58分享 / 0个评论
赞过的人: 技术头条 zhisheng_tian
要不要再学学下面的文章?
MySQL8.0.17 - Multi-Valued Indexes 简述 (yq.aliyun.com)
本文主要简单介绍下8.0.17新引入的功能multi-valued index, 顾名思义,索引上对于同一个Primary key, 可以建立多个二级索引项,实际上已经对array类型的基础功能做了支持 (感觉官方未来一定会推出类似pg的array 列类型), 并基于array来构建二级索引,这意味着该二级索引的记录数可以是多于聚集索引记录数的,因而该索引不可以用于通常意义的查询,只能通过特定的接口函数来使用,下面的例子里会说明。
by @可耐芊小仙女 2019-08-19 15:53 分享 查看详情
为了追求极致的性能,Kafka掌控了这11项要领! (mp.weixin.qq.com)
很多同学私信问我Kafka在性能优化方面做了哪些举措,对于相关问题的答案其实我早就写过了,就是没有系统的整理一篇,最近思考着花点时间来整理一下,下次再有同学问我相关的问题我就可以潇洒的甩个链接了。这个问题也是Kafka面试的时候的常见问题,面试官问你这个问题也不算刁难你。在网上也有很多相关的文章开讲解这个问题,比如之前各大公众号转载的“为什么Kafka这么快?”,这些文章我看了,写的不错,问题在于只是罗列了部分的要领,没有全部的详述出来。本文所罗列的要领会比你们网上搜寻到的都多,如果你在看完本篇文章之后,在面试的时候遇到相关问题,相信你一定能让面试官眼前一亮。
by @zhisheng_tian 2019-07-15 21:43 分享 查看详情
MaxCompute 费用暴涨之新增SQL分区裁剪失败 (yq.aliyun.com)
现象:因业务需求新增了SQL任务,这SQL扫描的表为分区表,且SQL条件里表只指定了一个分区,按指定的分区来看数据量并不大,但是SQL的费用非常高。费用比预想的结果相差几倍甚至10倍以上。分析:我们先明确MaxCompute SQL后付费的计费公式:一条SQL执行的费用=扫描输入量 ️ SQL复杂度 ️ 0.3(¥/GB)。变量主要是输入量和复杂度,但实际上复杂度最高也就为4,由复杂度引起的费用暴涨是比较罕见,我们不妨先把排查重点放在输入量上。
by @可耐芊小仙女 2019-07-09 15:19 分享 查看详情
面试官:HashMap 源码你都不知道还来面试? (mp.weixin.qq.com)
HashMap采用key/value存储结构,每个key对应唯一的value,查询和修改的速度都很快,能达到O(1)的平均时间复杂度。它是非线程安全的,且不保证元素存储的顺序。
by @zhisheng_tian 2019-06-29 13:57 分享 查看详情
Kafka数据迁移MaxCompute最佳实践 (yq.aliyun.com)
Kafka是一款分布式发布与订阅的消息中间件,具有高性能、高吞量的特点被广泛使用,每秒能处理上百万的消息。Kafka适用于流式数据处理,主要应用于用户行为跟踪、日志收集等场景。一个典型的Kafka集群包含若干个生产者(Producer)、Broker、消费者(Consumer)以及一个Zookeeper集群。Kafka集群通过Zookeeper管理自身集群的配置并进行服务协同。
by @可耐芊小仙女 2019-06-04 15:07 分享 查看详情
原理解析 | Apache Flink 结合 Kafka 构建端到端的 Exactly-Once 处理 (mp.weixin.qq.com)
1. Apache Flink 应用程序中的 Exactly-Once 语义

2. Flink 应用程序端到端的 Exactly-Once 语义

3. 示例 Flink 应用程序启动预提交阶段

4. 在 Flink 中实现两阶段提交 Operator

5. 总结
by @zhisheng_tian 2019-06-03 16:47 分享 查看详情
跟面试官聊到JVM,他99%会让你谈谈这个问题! (mp.weixin.qq.com)
但凡问到 JVM(Java 虚拟机)通常有 99% 的概率一定会问:在 JVM 中如何判断一个对象的生死状态?

本文就来聊聊这个问题,判断对象的生死状态的算法有以下几个:
by @HollisChuang 2019-05-15 10:01 分享 查看详情
《从0到1学习Flink》—— Flink 读取 Kafka 数据写入到 RabbitMQ (mp.weixin.qq.com)
之前有文章 《从0到1学习Flink》—— Flink 写入数据到 Kafka 写过 Flink 将处理后的数据后发到 Kafka 消息队列中去,当然我们常用的消息队列可不止这一种,还有 RocketMQ、RabbitMQ 等,刚好 Flink 也支持将数据写入到 RabbitMQ,所以今天我们就来写篇文章讲讲如何将 Flink 处理后的数据写入到 RabbitMQ。
by @zhisheng_tian 2019-04-01 21:54 分享 查看详情
如何查看 Linux 下 CPU、内存和交换分区的占用率? (linux.cn)
在 Linux 下有很多可以用来查看内存占用情况的命令和选项,但是我并没有看见关于内存占用率的更多的信息。

在大多数情况下我们只想查看内存使用情况,并没有考虑占用的百分比究竟是多少。如果你想要了解这些信息,那你看这篇文章就对了。我们将会详细地在这里帮助你解决这个问题。

这篇教程将会帮助你在面对 Linux 服务器下频繁的内存高占用情况时,确定内存使用情况。
by @技术头条 2019-03-27 21:07 分享 查看详情
消息中间件Kafka与其他的相比之下谁更diao? (mp.weixin.qq.com)
在 IM 这种讲究高并发、高消息吞吐的互联网场景下,MQ 消息中间件是个很重要的基础设施,它在 IM 系统的服务端架构中担当消息中转、消息削峰、消息交换异步化等角色。
by @zhisheng_tian 2019-03-20 12:28 分享 查看详情