Intercomb님께서 좋은 피드백을 남겨주셨습니다. 그리고 그에 대한 답변 여기에 공유하도록 하겠습니다.
네네 뼈아픈 피드백 감사합니다^^ 일단 저보다 이쪽에 더 많은 경험과 지식을 갖고 계시는 intercomb님이 시간 내주셔서 말씀해주신 논리들을 그나마 defense를 해보자면..
1. 개체 값이 부족하다는 부분: 데이터양이 턱없이 부족하다는 점은 본문에 여러 번 명시해 놓았습니다ㅠㅠ 일단 전 예전부터 몬테카를로나 부트스트랩과 같은 Random sampling 혹은 난수/임계값들을 generate해 데이터량을 불리는 방법론을 부정적인 시선으로 바라보고 있었던 사람 중 한명입니다. 아무리 기존의 데이터의 standard deviation을 가지고 그 확률 분포(Probability distribution) 안에서 재표본추출로 데이터를 뽑는다고 해도, 즉 참값을 도출하기위해 추정량을 아무리 많이 구해도 결국 이 둘의 분산은 각각 상수취급이 되기 때문에 기존의 분포 값만 반영이 되는 한계점이 있다는 걸로 알고 있습니다. 때문에 이러한 데이터양을 확보하기 위한 방법론들을 사용하면 오차가 너무 크게 나온다는 단점이 존재합니다. 여담으로 아직 인류는 random이라는 수치를 100% 객관적으로 생산하는 기술에 아직 도달하지 못했다고 생각합니다. 엑셀에서 =random()이라는 함수가 정말로 백퍼센트 랜덤 수치인지 아닌지는 알 방법이 없습니다. 단순히 트뷰에 글을 개재하는 게 아닌 논문이나 제안서를 작성하는 거였으면 당연히 더 신경을 썼을 부분인데 ㅠㅠ 당연히 연구자 입장에서는 이부분을 제일 먼저 지적했을 것입니다.
2. 데이터분석과정에서 특수한 경우를 포착해서 경향성을 파악한 게 아니라고 한 부분: 본 분석은 프랙탈이라는 이론을 활용해보자는 궁극적인 취지가 있었기 때문에 이 이론의 경향성이 적용이 가능하다고 판단되는 경우들을 포착했을 뿐입니다. 특수한 경우를 포착했다는 게 무슨 말인지는 잘 이해가 가지 않지만, 제가 애초에 추진하고자 했던 방향은, Macro한 관점에서 색출한 특정 패턴/구조 내에 자기유사적인 Micro한 패턴/구조의 존재 여부와 그의 빈번도를 찾아내는 거였습니다. 그리고 수집한 각각의 자기유사적인 미시적 패턴/구조 이후에 출현한 가격 흐름들을 데이터화 시켜, 그 구조가 형성되기 전과 도중에 관찰되는 여러 특성(넓이, 거래량, 시간폭, 가격폭, 기술적요소 등)과 이후에 형성되는 추세 방향, 변동폭, 그리고 가격 모멘텀 성질 간의 인과관계(Causal Relation)을 모델링해 미묘하더라도 두 모집군간의 경향성을 도출하면 의미가 있을거라고 생각했습니다. 하지만 언급 드렸듯 수작업(manually)으로 데이터를 수집하다보니 객관성도 떨어지고, 완전히 독립적인 기준을 유지하기가 힘들어서 난항을 겪었습니다. 만약에 제가 연구실에서 충분한 기술력(소프트웨어, 인력 등)과 시간적인 여유와 지원이 있었으면 더 정교하고 세밀한 기준으로 일관성있는 데이터를 추출했을건데.. 그러한 인프라가 없이 혼자 개인으로 분석을 진행했던지라 많이 부족한 점 저도 잘 알고 있습니다. 저도 한때 연구실에서 연구를 했던 사람으로써 본 분석이 연구라고 불리기엔 형편이 없다는 건 잘 인지하고 있습니다ㅠㅠ
3. 비선형적 차트중에 원하는 부분을 짜깁기해 데이터적 쓰임새가 없다는 부분: 2번 내용과 비슷한 내용입니다. 거시적인 그림에서 관찰되었던 패턴/구조처럼 추세 지속 도중 왼쪽 하단, 중앙 상단, 오른쪽 하단, 이렇게 3개의 큰 박스권 형태로 매물대를 구분화 시킬 수 있는 경우들을 미시적인 그림에서 최대한 객관적인 기준으로 찾아 데이터화를 시켜놓았습니다. 프랙탈 이론을 적용시키는 게 메인 취지였기 때문에 다른 잣대를 가지고 오는 건 이 분석 scope밖이라고 생각했습니다. 이걸 만약에 프로그래밍이나 소프트웨어를 활용해 수집을 했다면 덜 주관적일 수는 있었겠지만 말씀드렸듯 그럴 여건이 주어지지 않았습니다. 제가 지금 봤을 때 종속변수들을 다른 형식으로 도출하는 게 더 나았을 것 같네요. intercomb님이 말씀드린 웬만한 것들은 제가 다 한계점으로 글에 기재했고 제가 분명 이러한 일련의 분석 과정을 디자인했지만 샘플 수와 방법론을 비롯한 다양한 한계점들 때문에 신빙성이 있는 결론에 닿지 못했으니 대충 이러한 취지로 이러이러한 단계들을 거쳐서 분석했구나 정도로만 받아들여 주셨으면 한다고 말씀드렸습니다.
4. 오른다 내린다 두가지를 모두 결론을 내놓으셨다라는 부분: 먼저 글에서 제가 특정화시켜놓은 구조/패턴이 형성되기 전 추세가 지속되는 경우는 총 24번, 반대로 추세가 반대로 나온 경우는 총 32번으로 단순히 빈번도(Frequency)만 놓고 봤을 때는 추세가 반대로 갈 경향성이 유력하다는 결과를 도출했다고 명시했습니다.
제가 추후에 분석을 다시 제대로 진행을 할 기회가 주어진다면,
1. 더 적은 봉으로 들어가, 즉 더욱 더 micro한 관점으로 들어가 샘플들을 채취하면 훨씬 많은 양의 데이터를 채취할 수 있을 것 같습니다.
2. 인간의 육안과 손이 아닌 컴퓨터언어로 프로세싱했다면 더 객관적이고 정밀한 데이터를 뽑을 수 있지 않을 까 싶습니다.
3. X변수와 Y변수의 기준을 다르게 설정해야 할 것 같습니다. 물론 그 전에 여러 변수들 중에 어떤 변수들이 더 관계성에 기여를 하는지 선정하는 작업부터 선행되어야 될 것 같고요. 예를 들어 저는 그냥 단순히 각 박스권들의 넓이(시간 X 가격)와 거래량만 가지고 독립변수로 설정을 했는데 시간이 주어졌다면 다른 의미 있는 변수들이 뭐가 있는지 먼저 문헌고찰과 개인적인 고찰을 통해 여러 개를 뽑고, Structural Equation Modeling 등과 같은 구조방정식 류의 방법론을 통해 더 가중치가 있는 변수들을 선정했었다면 모델링하는데 있어 통계학적으로 더 신뢰성있는 결론에 도달하지 않았을까 싶습니다.
4. 인과관계 모델링을 위해서는 1~3번 과정을 통해 확보된 데이터들을 심도 있게 관찰하고 선행 연구들과 사례들을 고찰한 뒤 취지와 상황에 적합한 방법론을 모색하는 게 옳은 방향이라고 생각합니다.
마지막으로 제가 이런 류의 분석글을 업로딩한 가장 큰 이유는, 트레이딩뷰를 포함한 국내 기술적분석 커뮤니티에 매일 똑같고 진부한 기법들을 활용한 분석글들과 관점들만 올라오고 있어서 타 오써분들도 저처럼 새로운 영역에 도전해본다면 언젠간 우리 개미들의 온라인 커뮤니티 산업도 큰 도약의 발전이 이루어질 수 있지 않을까 싶었습니다. 국내 TA 커뮤니티에 활동하고 계시는 많은 분들에게 큰 영감, 동기부여, 그리고 인사이트를 제공해드리는 데에 선도적으로 도모하고 싶은 마음이 컸던 것 같습니다. 이런 류의 분석글은 형편성과 신빈성도 당연히 중요하지만 기존의 정보, 사례, 및 인프라가 부족한 영역에 최초로 발을 딛은 분들의 도전정신을 높게 사 주셨으면 감사하겠습니다!
통계학적인 지식이 많이 부족하지면 그래도 시간 내주셔서 이렇게 진귀한 피드백 남겨주셔서 너무 감사합니다! 단순히 남을 깎아내리려는 의도가 아닌, 이러한 건설적인 취지의 논의와 토론이 트레이딩뷰 커뮤니티 내에서 많이 이루어졌으면 하는 바램입니다^^ 성투하세요!