2015년 7월 24일 금요일

집단지성 위키백과(Wikipedia) API 활용하기

세계인의 집단지성으로 만들어지는 위키백과 사전의 데이터 조회 API에 대해서 간략히 다룬다.
참고 : https://wikipedia.readthedocs.org/en/latest/code.html

예제로 필자의 현재 위/경도 정보를 통해서, 반경 10km에 등록된 "의미군"을 찾고, 관련 내용을 조회해 보겠다.
( "의미군" : 위키백과 속성으로는 "Title"과 매칭된다.)

1. 현재 위/경도 정보는 구글 지도에 들어가면 바로 조회된다.

오른쪽 하단에 내 위치를 클릭하고, 주소 창에 보이는 위/경도를 가지고 오자.

2. 수집한 위/경도 정보를 통해서 위키백과 사전에 정보를 조회해 본다.

In [1]:
import wikipedia as wk
# 필자가 자신있는 한국어를 통해서,
wk.set_lang("ko")
wk.geosearch(37.5000201,127.0364249,results=10,radius=10000)
Out[1]:
['강남 파이낸스 센터',
 '선릉역',
 '매봉산 (강남구)',
 '서울특별시강남교육지원청',
 '강남구청역',
 '삼풍백화점 붕괴 사고',
 '서울교육대학교',
 '휘문고등학교',
 '횃불트리니티신학대학원대학교',
 '코엑스']
In [2]:
# 깔끔해보이는 코엑스 페이지를 가지고 온다.
p = wk.page('코엑스')
In [3]:
# 코엑스에 대한 분류를 조사하고, 관련 이미지를 가지고 온다.
from IPython.display import HTML
print(' / '.join(p.categories))
s = ['<tr>']
for i in p.images[0:5]:
    s.append('<td><img style="width: 120px;" src=%s></img></td>' % i)
s.append('</tr>')
HTML('\n'.join(s))
분류:1979년 설립 / 분류:대한민국의 컨벤션 센터 / 분류:서울특별시의 경제 / 분류:서울특별시의 기업 / 분류:한국종합무역센터
Out[3]:

백과 사전이라는 것이 편중 될 수 있는 일부 학자들의 정의가 아닌 집단 지성에서 나온다는 단순하면서 빅데이터(BIGDATA)스러운 이 생각이 크다란 바람을 일으키고 있다.
참고:  https://www.ted.com/talks/jimmy_wales_on_the_birth_of_wikipedia?language=ko#

시리(Siri)가 위급할때 마다 찾는 위키(Wiki), 참 매력적이다.

0 개의 댓글:

댓글 쓰기