700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > java spark 环境_在 IntelliJ IDEA 中配置 Spark(Java API) 运行环境

java spark 环境_在 IntelliJ IDEA 中配置 Spark(Java API) 运行环境

时间:2023-02-13 10:09:15

相关推荐

java spark 环境_在 IntelliJ IDEA 中配置 Spark(Java API) 运行环境

1. 新建Maven项目

初始Maven项目完成后,初始的配置(pom.xml)如下:

2. 配置Maven

向项目里新建Spark Core库

xmlns:xsi="/2001/XMLSchema-instance"

xsi:schemaLocation="/POM/4.0.0 /xsd/maven-4.0.0.xsd">

4.0.0

net.libaoquan

TestSpark

1.0-SNAPSHOT

org.apache.spark

spark-core_2.11

2.2.1

3.新建Java类

新建Java类,写入Spark(Java API)代码:

import org.apache.spark.api.java.*;

import org.apache.spark.SparkConf;

import org.apache.spark.api.java.function.Function;

public class TestSparkJava {

public static void main(String[] args) {

String logFile = "D:\\ab.txt";

SparkConf conf = new SparkConf().setMaster("local").setAppName("TestSpark");

JavaSparkContext sc = new JavaSparkContext(conf);

JavaRDD logData = sc.textFile(logFile).cache();

long numAs = logData.filter(new Function() {

public Boolean call(String s) { return s.contains("0"); }

}).count();

long numBs = logData.filter(new Function() {

public Boolean call(String s) { return s.contains("1"); }

}).count();

System.out.println("Lines with 0: " + numAs + ", lines with 1: " + numBs);

sc.stop();

}

}

运行项目,结果如下:

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。