관찰된 데이터를 가지고 인과관계를 찾는건 쉬운일이 아니다. 때때로 상관관계까지만 얻어낼수 있는 데이터를 인과관계까지 발전시키는 경우도 있다. 잡담을 하자면..
이 기사는 있는 그대로 상관관계로 받아 들여야지..
"부자여서 기부를 덜한다." 인지, "기부를 덜해서 부자가 되었다." 인지 확인하는 건 쉽지 않다.
2. 실험의 결과 (논문의 경우)
예를 들면, 동성애의 이유를 밝히기 위해서, 동성애자와 일반인의 뇌를 비교하였을때, 동성애자인 사람들이 뇌의 특정 부위가 다른 사람보다 발달했을 경우..
그 부위 때문에 동성애자가 되었는지, 동성애자여서(다른이유로) 그 부위가 발달하였는지 단정하기 힘들다.
3. 뉴스 및 신문의 Top기사 (첫기사 or 첫면 or 할당량)
중요한 뉴스라서 top기사가 되는지, top뉴스로 올려서 중요한 기사가 되었는지 잘 생각해 봐야 한다. 언론이 통제 받는 경우에 권련기관이 중요한 뉴스를 결정(편집자에게 압력을 주어서)하는 경우가 많아 진다. 작은 기사라고 중요하지 않은 기사는 아니다.
정치적으로 안좋은 이슈가 있을 때, 살인, 강간, 간첩 등의 기사가 탑뉴스로 나오는 건 인과관계? 상관관계? 잘못된 관찰?
# 1.
데이터를 분석할때 상관관계의 데이터에서 한쪽 방향으로인 인과를 찾는일은 소비적인 일일 수도 있다. 필요하다면 그냥 아무쪽이나 인과관계를 가정해 버리고 써도 될것 같다. 순수한 인과관계가 있는지 없는지도 모르겠고.. 원인->결과 에서 결과도 원인에서 영향을주기 때문에..
# 2. 인터넷 로그..
로그의 경우에 유저의 로그를 시간 순서로 볼수 있기 때문에 인과 관계가 명확할것 같지만, 꼭 그렇지도 않을것 같다....
로그에 유저의 (A -> B)의 액션셑이 많다는 건..
1) A를 해서 B를 할수도 있지만,
2) B를 하기 위해서 A를 할수도 있다. (UI나 시스템의 특성 때문에 B를 하려면 A로 가야 편하기 때문일 수도.. )
이를 테면, 다음에서 가계부를 바로 들어가는건 불편하다. (적어도 나는 쉽게 들어가는 방법을 모른다.) 나에게 편한 방법은, 메인 화면에서 '메일'을 누르고 다음 메일로 들어가서, 위쪽 메뉴에서 '가계부'로 가는게 편하기 때문에 보통은 그런 방법으로 접근한다. 이런경우 "메일을 사용하면 가계부를 많이 사용한다!"라는 결론은?
# 3.
지금하는 분석중에 하나는..
쿼리 A -> B에서.. A와 B는 결과 T를 찾기위한 과정의 쿼리이고, A에서 만족스럽지 못해서 B를 날렸다고 가정한다.
복잡하니까.. 그냥 단순하게.. ;
# 4.
변수는 너무 많은데, 경험이 많지가 않다. 결과를 의심하는 자세를..