据偶自己的编程经验来说,如果用Java做大数据的话,无非Hadoop和Spark这两块了。
Hadoop
Hadoop无非是MapReduce那套,用到Java中的spring,springmvc是前端相关的库,mybatis是一个数据库操作库,如果走算法这条路,精通Hadoop的相关api,以及怎么和hive,habse交互,比再开辟一条前端技术栈,折腾spring要划得来.
Spark
Spark开发的话真心不推荐Java来写代码,推荐Scala语言,原因一来这是Spark官方支持的语言,二来对于初学者来说,Scala的教程相对较多。