티스토리 뷰
반응형
SMALL
Create DataFrame from Dictionary Array
from pyspark.sql import Row
valuesA = [('Pirate',1),('Monkey',2),('Ninja',3),('Spaghetti',4)]
rdd1 = sc.parallelize(valuesA)
rddA = rdd1.map(lambda x: Row(name = x[0], id = x[1]))
TableA = sqlContext.createDataFrame(rddA)
# TableA1 = spark.createDataFrame(valuesA, ['name', 'id'])
valuesB = [('Rutabaga',1),('Pirate',2),('Ninja',3),('Darth Vader',4)]
rdd2 = sc.parallelize(valuesB)
rddB = rdd2.map(lambda x: Row(name = x[0], id = x[1]))
TableB = sqlContext.createDataFrame(rddB)
# TableB1 = spark.createDataFrame(valuesB, ['name', 'id'])
TableA.show()
TableB.show()
Alias Table
ta = TableA.alias('ta')
tb = TableB.alias('tb')
ta.show()
tb.show()
Inner Join between two Tables
inner_join = ta.join(tb, ta.name == tb.name)
inner_join.show()
Left Join between two Tables
left_join = ta.join(tb, on = "name", how = "left")
left_join.show()
left_join2 = ta.join(tb, ta.name == tb.name, how='left') # Could also use 'left_outer'
left_join2.show()
반응형
LIST
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- Kotlin
- apple
- android
- databinding
- 스위프트
- C++
- 상속
- 오토레이아웃
- java
- Swift
- 함수형
- ios
- Auto Layout
- Rxjava
- 아이폰
- 컬렉션
- CloudComputing
- 함수형프로그래밍
- Reactive programming
- retrofit
- Notissu
- watchos
- SwiftUI
- 알고리즘
- Elliotable
- 안드로이드
- 애플워치
- Apple Watch
- 코틀린
- XCode
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
글 보관함