영화평론을 평론하는 기계 영화

문자 그대로의 의미입니다.

저녁시간의 짬에 후다닥 만들어낸 다음 웹페이지는 이렇습니다: 영화평론을 써서 입력하면, 듀나, 정성일, 김혜리, 이동진, 김영진, 곽재식 중에서 누구의 글에 가장 가까운지 평해 줍니다. 예시는 아래와 같습니다.


사이트는 위와 같이 생겼습니다.


이렇게 "해리포터와 불사조 기사단" 영화평을 써 넣습니다.


그리고, 분석개시 버튼을 누르면, 잠시후...


위 글이 누구의 평과 비슷한지 말해주고, 각각의 닮은 정도 점수를 수치로 줍니다. 위의 경우에는 "듀나"의 평과 흡사한 영화평이라고 말해 주었습니다.

이 주소 http://gerecter.100webspace.net/ 에서 해 보실 수 있습니다.

자칫 영화평은 비슷비슷한 단어를 들먹이게 되는 경우가 많기에, 사람마다 계속 반복해서 읊조리는 단어가 뚜렷하게 나타나지 않을까 생각해서 한 번 만들어 본 것이었습니다. 매우 간단하게 이 글에서 http://djuna.cine21.com/bbs/view.php?id=main&no=78271 언급된 방식으로 여섯 사람의 글들에서 통계를 냈고, 더 간단한 모형으로 점수를 계산하게 되어 있습니다. 여섯 사람의 글에서 추출한 자료에 대해 직교성을 거의 검증하지 않았고, 훈련자료 집합도 매우 작았던 데다가, 검정자료 집합은 더욱 부실해서, 모형을 조정할 여지는 얼마든지 있습니다.

그런즉, 재미삼아 한 번 돌려 볼만한 것이라는 이야기입니다.

핑백

  • 게렉터블로그 : 영화평론을 평론하는 기계 는 옳은가? 2007-08-16 15:43:21 #

    ... 어제 올렸던 "영화평론을 평론하는 기계"에 대한 글 http://gerecter.egloos.com/3336554 에서, 기계를 돌려서 영화 평론이 누구의 글과 닮았는지 분석하는 것에 대한 이야기를 했습니다. 그런데, 과연 이게 얼마나 맞 ... more

  • 개념은 없음, 불만은 많음, 성질은 나쁨, 예의는 꽝 : 이오공감? 인정할건 좀 인정하자 2007-08-17 16:40:54 #

    ... 다. 공감하고.이오공감이 예전과 다른 이유?당연히 다르지. 사람들이 좋아하는게 노출이 많이 되니까. 하지만 또 다른 것도 있다. 최근 '영화 평론을 분석해서 어느 평론가 스타일의 글인지 알려주는 프로그램'에 관한 포스트가 있었다. 알고리즘은 그리 복잡하지 않다. 영화 평론가마다 자주 사용하는 단어가 있고, 그 단어가 많을 수록 더 그 평 ... more

덧글

  • 이녁 2007/08/14 18:40 # 답글

    곽재식스럽고 듀나스러운 맛도 있다고 나왔습니다.
  • 충격 2007/08/14 18:44 # 답글

    듀나스럽고 게렉터님스런 맛도 있다고 합니다 ㅎㅎ
  • 꼬질 2007/08/14 18:57 # 답글

    와...아직 해 보진 않았지만 참신하네요. 계속 반복해서 읊조리는 단어라...
  • 퍼프 2007/08/14 19:00 # 답글

    이거 너무 재밌네요!
  • ArborDay 2007/08/14 19:02 # 답글

    대여섯개 돌려봤는데 아직 글쓰기의 형태가 잡히지 않은 탓인지, 모든 분들의 점수가 비슷하게 나오네요. 게렉터님스런 맛도 좀 있다고 하는군요. 조금 성의있게 쓴 글들은 정성일, 이동진 조합이 많이 나오네요. 재미있습니다. 이동진이 제일 많은 것 같아요.
    이거 업데이트 좀 하면 무서운 모형이 되겠는걸요. ^^
  • Cynic 2007/08/14 19:06 # 답글

    저도 대여섯개 돌려봤는데 이동진이 제일 많더군요. 가끔 정성일, 김혜리도 나오네요.
  • 슈리 2007/08/14 19:48 # 삭제 답글

    곽재식님은 게렉터님인가요? 이거 참 재미있는 꺼리네요.
  • duvet 2007/08/14 20:19 # 답글

    트랙백해갑니다 :)
  • 세바스찬 2007/08/14 21:06 # 답글

    이오공감에서 보고 왔습니다.
    재미있네요. 대여섯개 돌려봤는데 저는 이동진님+곽재식님 조합이 가장 많이 나왔습니다.
  • rumic71 2007/08/14 21:32 # 답글

    저도 이동진이 주로 나오는군요
  • 미모사 2007/08/14 21:46 # 답글

    할 때마다 달라지는데, 수치로 따지면 듀나가 가장 높게 나왔군요,
  • 트랜샌드 2007/08/14 21:48 # 삭제 답글

    이오공감에서 보고 왔습니다.

    제가 느끼기엔 제 글은 듀나 스타일이라는 느낌이 강한데, 여기 돌려보니 정성일스럽다는군요. -ㅁ-
    재미 있군요. 히히
  • 염맨 2007/08/14 22:02 # 답글

    가장 최근 것들은 대체로 정성일-김영진이군요. 음 전 평균점수가 꽤 높은 듯한..(마치 시험점수가 높다고 말하는 것 같잖아!)
  • 2007/08/14 22:11 # 삭제 답글

    재밌는 내용.. 데려갑니당~^^
  • 이준님 2007/08/15 13:36 # 답글

    이 글은 곽재식 스럽고, 이동진 스러운 맛도 있습니다.

    듀나 성향 점수: 3760
    정성일 성향 점수: 3747.5
    김혜리 성향 점수: 3885
    이동진 성향 점수: 4030
    김영진 성향 점수: 3675
    곽재식 성향 점수: 4180

  • asdf 2007/08/15 16:24 # 삭제 답글

    이야아... 멋진데요.
  • 탁이 2007/08/15 22:20 # 답글

    하하. 기발하고 재밌는 생각이예요. 대단한 분이시다!!
  • 2007/08/16 03:26 # 삭제 답글 비공개

    비공개 덧글입니다.
  • 게렉터 2007/08/16 06:39 # 답글

    비공개/ 맞습니다.
  • 마시마로 2007/08/16 16:25 # 답글

    이런 기계가 있다니 재미있네요. 저의 글은 대체로 이동진씨의 평론과 비슷하게 나오네요.
  • 놀라 2007/08/18 02:23 # 삭제 답글

    실험삼아 실제로 듀나가 쓴 글을 분석하게 했더니 결과로 듀나 성향이라고 나오더군요. ^^ 대단해요.

    매우 "훌륭한" 장치로군요. 분석소의 설정에 매우 신경을 쓰신... 모양입니다.

  • 게렉터 2007/08/26 21:27 # 답글

    마시마로, 놀라/ 더 재미난 것은 "분석소의 설정"에 신경을 하나도 안 쓰고 그냥 기계적으로 반복하는 단어의 빈도만 수집해서 짜넣었는데도 이정도 결과가 나왔다는 것입니다. 좀 더 발전된 이야기를 할 날이 또 있으리라 생각합니다.
  • 심리 2007/11/18 17:25 # 답글

    놀랍네요! 영화평론 인공지능? ^_^ 개인마다 자주 쓰는 단어가 있다는 거..... 그렇군요. 단어가 중요한 것이었다는......
  • 게렉터 2007/11/19 13:22 # 답글

    심리/ 개인마다 자주 쓰는 단어가 얼마나 더 다르냐, 어느 부분에서 얼만큼 서로 차이가 나느냐, 하는 것을 정확하게 따지는 것이 "직교성"을 살피는 것이 될텐데, 위의 것은 그런 부분에서 사실 고려가 상당히 부족합니다.
  • 불별 2013/07/15 16:34 # 답글

    안녕하세요. 문득 이 재미있는 기계가 생각나서 검색해보니 무려 6년 전에 만드신 거였군요;
    혹시 어떤 언어로 만드셨는지 알 수 있을까요? (역시 perl이려나요..)
  • 게렉터 2013/07/19 23:59 #

    회귀분석용 자료 뽑아내는 것 자체는 Java로 따로 만들어서 돌렸고, 그 결과 모델을 HTML 파일에 써둔 후 입력하는 글을 분석하고 모델 적용시키는 것은 자바스크립트로 모두 처리했습니다.
댓글 입력 영역