首页 - 求职范文 > 北京快手大数据研发技术面经

北京快手大数据研发技术面经

发布于:2024-09-19 11:39

昨天面的, 下午2点到6点多, 全程见了2位HR和4位研发, 其中2位研发是比较高级的leader. 目前等HR回复中

自己之前在小公司做了2年大数据, 人手少, 哪里需要哪里搬, 所以这次被考察的面也有点广

题目做了一下简单记录, 会有遗漏, 并且没有按顺序哈. 个人觉得大概回答下来80%多吧

Java

1. HashMap的底层数据结构, 为什么JDK8要用红黑树. ConcurrentHashMap的底层数据结构, 如何保证线程安全

2. synchronized关键字的本质, 作用是什么. volatile关键字的作用, 哪些情况下会用它

3. Java线程的几大状态及转换. 线程可重入是什么概念, 可重入锁呢

4. 如果要设计一个线程池, 需要考虑哪些要素. Executors工厂类能创建哪些线程池, 用过哪些

5. 讲一讲熟悉的设计模式. 单例模式及工厂模式的实现方法. 装饰器模式是怎么一回事

6. 讲一讲熟悉的JVM GC算法, 常用的垃圾收集器. CMS有什么优缺点

7. 一个Java应用上线后, 关注哪些性能指标. 如果响应时间过长或者CPU占用过高, 如何排查, 用哪些工具或命令

大数据组件

1. 是否自己搭建的集群, 集群节点数及配置

2. Hadoop的XML配置文件有哪些, 改过哪些参数, 分别代表什么含义

3. HDFS NameNode高可用如何实现, 需要哪些角色. YARN有哪些组件, 如何分配资源

4. Spark RDD有哪些特点, 宽依赖和窄依赖. RDD的缓存级别

5. DAGScheduler及stage如何划分. 给一个比较复杂的RDD lineage, 手动划分stage和task

6. Spark Streaming以一定的时间窗口统计PV/UV, 如果窗口内数据量暴涨, 如何保证稳定性. 如果会延迟上报, 如何保证实时性

7. Kafka与Spark Streaming集成, 如何保证exactly once语义

8. Spark/Hive中大表join小表的优化方法. 数据倾斜和shuffle调优方法

9. 调整过Hive的哪些参数, 用什么执行引擎. Hive UDF怎么写, 写过哪些. HiveQL是怎样解析成MR/Spark job的

10. HBase的数据在HDFS上是怎样存储的, 写入数据的流程是怎样的. 为什么HBase适合写多读少业务

11. HBase的一个region由哪些东西组成. RegionServer宕机之后如何感知, 如何迁移数据

12. 为什么选用Kudu作为HBase和Hive的折中方案, 它有什么特点. 如果不用Kudu, HBase的二级索引能解决问题吗

13. Impala的查询及执行与Hive有什么不同 [PS. 我之前的项目里用了Kudu+Impala]

数据仓库设计

1. 之前业务中的数据仓库是如何分层的, 怎样建模, 主题如何划分

2. 从ODS到DW层的ETL, 做了哪些工作

3. 1~3NF的含义. 维度建模中星型模型和雪花模型的不同. 代理键是什么, 支架表是什么

4. 如何处理缓慢变化维. 怎样建设拉链表, 如何在拉链表中恢复最新数据

算法和应用题

1. 最长公共子序列(LCS)问题. 动态规划

2. 找出二叉树中任意两个节点的最低公共根节点, 如果树是BST呢. 深度优先搜索+二分查找树性质

3. 10亿条64B长的URL, 限定1G内存, 做计数, 如果要TopN的话呢. 哈希分桶+堆排序时间复杂度

4. 用户行为日志有UID和时间戳, 设定一个session间隔. 离线及在线地计算用户的平均session长度

5. 之前做过标签推荐系统, 详细讲一下架构和自己设计的算法. 算法流程是行为评分+指数衰减+线性归一化+余弦相似度/皮尔逊相关性+TF-IDF打压

2
二维码

扫一扫手机访问

简介:北京快手大数据研发技术面经是一篇相关于职场文章,最新最全的职场百科信息平台,本文内容仅供参考学习,并不代表本平台观念,职责网。

标签:

相关文章

  • 数据整理分析岗位职责

    1、负责销售信息记录和数据库更新;2、对订单的相关数据进行分析和统计;3、检查、整理及保存销售档案;4、负责厂家邮件收发处理及部门日常行政事务;5、完成上级委派的其他临时性工作。任职要求:1、本科及以上学历,专业不限,对数据有一定的敏感性;2、具备良好的执行力,责任心较强,细心耐心;3、熟练操作Exc..

    2025-04-03

  • 计算机支撑中心数据分析岗位职责

    1.收集、分析BOSS、增值业务系统的基本运营数据,生成规范、准确的统计数据和报表,为职能部门决策提供依据。2.参与报表程序设计、开发,确认数据统计口径,确保程序开发符合实际需求。3.汇总、生成计算机支撑中心的报表,指导县公司进行相关数据分析,确僻2营工作正常开展。4.审核日报、月报数据,保证..

    2025-02-27

  • 算法工程师岗位职责是什么?

    算法工程师是指利用算法解决问题的技术人员,算法是指可以解决问题的清晰指令,也就是通过规范的输入,可以在有限的时间内得到需要的输出。而算法工程师的岗位职责有以下几点:1、参与算法有关项目的技术研究,善于进行规范化的产品开发及技术测试;2、负责图像处理、目标跟踪、动作捕捉等领域的算法研..

    2024-11-09

  • 数据运营岗位职责是什么?

    数据运营是指通过技术手段,收集并归纳总结各种数据,整理其中所蕴含的信息,并将其作为商品提供给具有数据需求人群使用的专业人员。数据运营岗位的主要职责有:1、负责监控并分析客户的业务、运营、产品等相关数据,并对其提出业务发展的可行建议;2、对产品的运营数据进行分析,通过数据变化情况分析..

    2024-10-21

  • 数据治理岗位职责

    数据治理岗 岗位职责:1.识别、分析客户数据治理需求,为客户提供数据集成、数据治理、数据管理解决方案;2.承担大数据解决方案及架构的规划与设计,产品和技术规划,以解决业务痛点,并提供有竞争力的解决方案功能和技术特性,主要方向为数据治理解决方案,包括数据架构设计、数据标准管理、元数据管理、数据..

    2024-11-30

  • 数据制作岗位职责

    数据制作工程师 湖北亿咖通科技有限公司 湖北亿咖通科技有限公司,亿咖通科技 工作职责:1. 负责管理和指导数据生产制作,与各产品部门密切沟通,准确拆分数据产品需求,准确把握数据生产工艺,建立数据生产能力;2. 协助项目经理制定和落实生产计划,寻找解决问题和满足需求的方法及资源,带领作业团队运用平台..

    2024-11-16

  • 数据中心主任岗位职责

    数据中心网络管理主任工程师 美的集团IT部(集团总部) 美的集团流程与IT部(集团总部)分支机构 职责描述:1、负责全球数据中心网络建设和管理,能够进行数据中心网络架构规划、设计及性能优化;2、负责全球数据中心、容灾中心基础网络建设项目;3、负责数据中心、容灾中心基础网络日常运维和故障处理;4、负责..

    2024-09-26

评论问答