급락 종로하늘, 최저 스카이에듀.. '학평 영향'

[베리타스알파=박대호 기자] 10월학평 종료 직후 발표한 입시기관들의 등급컷은 과연 얼마나 신뢰할 수 있었을까. 최근 발표된 10월 학평 성적을 기반으로 11개 입시기관이 예측했던 국어 수학(가) 수학(나) 영어의 4개영역 기준 1~2등급컷인 8개의 등급컷을 실제결과와 대조해본 결과 유웨이중앙교육(유웨이)와 메가스터디(메가)가 각각 6개의 등급컷을 맞히며 뛰어난 분석력을 자랑했다. 다만, 메가스터디가 학평 당일 시험이 종료되기도 전부터 예측등급컷을 발표하며 현장에 혼란을 가져다 줬으며, 예측등급컷은 5개를 맞히는 데 그쳤다는 것을 고려하면 유웨이의 분석력에 손을 들어줄 수밖에 없었다. 반면, 스카이에듀는 단 1개의 등급컷도 적중시키지 못한 것으로 나타나 안타까움을 샀으며, 종로학원하늘교육(종로하늘)도 여타 기관에 비해 뒤떨어지는 분석력을 보인 입시기관으로 평가됐다. 
 
10월학평 등급컷 추정 관련 입시기관들의 특징은 스카이에듀와 종로하늘을 중심으로 전반적인 분석력이 9월모평과 달리 하향곡선을 그렸다는 점이다. 그간 입시기관들이 보여온 추세와 정반대로 돌아선 것이다. 3월학평부터 9월모평에 이르기까지 입시기관들은 날이 갈수록 등급컷 적중도가 상향평준화되는 모습을 보였다. 3월학평에서는 국어영역 등급컷을 단 1개 기관도 맞히지 못했고, 4월학평에서는 수학(가)를 맞힌 기관이 하나도 없는 등 특정 영역을 적중시키지 못하는 모습이 연이어 나왔으나, 6월모평에서는 적중하지 못한 영역이 사라지더니 9월모평에서는 전반적으로 1등급컷 적중도가 크게 향상됐다. 9개기관이 4개영역 등급컷을 모조리 맞혔고, 이투스 비상교육만이 1개 영역에서 엇나간 결과를 내놨을 뿐이다. 좋은 분석력을 선보였던 9월모평과 비교하면 10월학평 등급컷 분석에서는 다시금 분석력이 하향추세로 돌아선 것이다.

10월학평에서 기관들의 분석력이 하향 추세로 돌아선 것은 재학생만 시험에 응시하는 학력평가의 특성과 수능 이전 마지막 학평이라는 점 등이 복합적으로 작용한 것으로 풀이된다. 재수생이 응시 가능한 모평은 학원과 온라인강의 사이트 등을 보유한 입시기관들이 학평 대비 많은 표본을 바탕으로 뛰어난 분석력을 보인다는 것이 통설이다. 한 입시기관 관계자는 “9월모평보다 10월학평에서 등급컷 적중도가 낮은 것은 재수생의 포함 여부 차이 때문이다. 재수생이 투입되는 모평은 상대적으로 표본이 많아 등급컷을 추정하기가 쉽다. 시험 난이도 파악도 학평에 비해서는 용이한 편”이라고 말했다. 
 
▲ 최근 발표된 10월학평 성적을 기반으로 학평당일 발표했던 입시기관들의 등급컷 적중도를 따져본 결과 유웨이와 메가가 상대적으로 높은 적중률을 보였다. 반면 스카이에듀는 단 1개도 등급컷을 맞히지 못했으며, 종로하늘이 뒤따라 저조한 분석력을 보였다. /사진=베리타스알파DB
 
통상 입시기관들이 학평/모평 등 모의고사 당일 발표하는 예상등급컷은 시험을 마친 수험생과 학부모 등 교육 수요자들과 학교 교사, 업계 관계자 등 교육계 전반의 뜨거운 관심대상이다. 시험의 난이도를 간명하게 나타내는 지표면서 수능최저 충족 여부 등을 가늠해 볼 수 있는 근거이기 때문이다. 수요자들의 관심도를 높이기 위해 등급컷을 신중히 따지기보다는 성급히 발표해 현장의 혼란을 가져오는 사교육 업체의 윤리에 어긋난 행동이 종종 일어나는 이유다. 때문에 베리타스알파는 입시기관들의 분석력을 가늠하고자 최초 발표한 원점수 기준 등급컷의 실체를 따져왔다. 기관별 입시공력을 낱낱이 따져 교육수요자들에게 신뢰도 높은 입시기관이 어디인지 알리는 동시에 입시기관들에게 신중한 발표를 당부하기 위해서다. 
 
10월학평 등급컷 적중여부를 따진 입시기관은 EBS 김영일교육컨설팅(김영일) 대성 메가 비상교육 비타에듀 스카이에듀 유웨이중앙교육(유웨이) 이투스 종로하늘 진학사 등 11개기관이다. 때문에 일부 입시기관의 도움을 받아 기관별 발표내용을 참고해 1~2등급 구분 표준점수와 표준점수별 도수분포표 등 공개된 통계자료를 활용해 원점수를 역산하는 방식으로 등급컷 적중 여부를 따졌다. 원점수 기준 평균/표준편차가 공개되지 않아 기관별로 이견이 발생할 수 있는 모평과 달리 학평은 기관별 분석이 일치하므로 어느 입시기관의 도움을 받더라도 최종 결과는 동일한 구조다. 메가가 학평이 종료되기 전 체감 등급컷을 발표한 것까지 포함해 총 12개 등급컷이 분석력을 측정하는 대상이 됐다. 대부분의 상위권 대학이 의대 정도를 제외하면 수능최저로 2등급까지 활용하는 경우가 많다는 점을 고려, 수능이 코앞으로 다가온 만큼 측정범위는 2등급까지로 확대했다. 
 
<최고 적중률 유웨이.. ‘체감등급컷’ 혼란가중 메가>
10월학평에서 가장 뛰어난 분석력을 보여준 것은 유웨이였다. 유웨이는 1등급의 경우 국어 수학(가) 수학(나)에서 전부 등급컷을 맞혔으며, 2등급에서는 국어 수학(나) 영어의 등급컷을 적중시키는 데 성공했다. 1등급 4개영역, 2등급 4개영역 등 총 8개영역의 등급컷이 존재하는 상황에서 6개의 등급컷을 맞혀 단연 여타 입시기관들에 비해 앞선 모습이다. 
 
유웨이 뿐만 아니라 메가도 6개의 등급컷을 맞힌 입시기관이었지만, 두 차례에 걸쳐 등급컷을 내놨음이 고려돼야만 했다. 이른 등급컷 발표로 인해 난이도 파악 관련 현장의 혼란이 발생할 수 있는 점, 통상 빠른 발표가 언론 및 수요자들의 주목을 끌기 위해 행해진다는 점 등을 고려하면 유웨이가 동일한 분석력이라 할지라도 더 바람직한 모습을 보였다고 할 수 있다. 
 
10월학평 당일 시험 종료 이전부터 체감등급컷이란 명목으로 현장의 혼란을 야기했던 메가는 이후 1시간 30분이 지나서야 확정 등급컷을 내놨다. 9월모평 당시 국어 2등급컷을 84점으로 발표했다가 83점으로 슬그머니 고쳤던 일이 10월학평에서도 재현된 것이다. 더하여 체감등급컷은 5개, 확정등급컷은 6개로 적중도도 서로 달랐다. 오히려 체감등급컷 기준으로는 적중했던 수학(가) 2등급컷이 확정등급컷으로 변경하는 과정에서 오답이 된 불상사가 존재해 괜시리 등급컷을 바꿨다는 평가만 받게 됐다.
 
<분석력 최저 스카이에듀.. 급락 종로하늘>
상대적으로 뛰어난 분석력을 보인 유웨이 메가와 달리 최저 분석력을 보인 입시기관은 스카이에듀였다. 스카이에듀는 1~2등급 포함 국어 수학(가) 수학(나) 영어의 8개 영역 가운데 단 1개영역의 등급컷도 맞히지 못했다. 1등급컷의 경우 국어 수학(가), 2등급에서는 국어가 각각 1점 어긋난 것이 아쉬움을 자아낸 지점이었다. 
 
스카이에듀의 뒤를 이어 저조한 분석력을 보인 입시기관으로는 종로하늘이 꼽혔다. 종로하늘은 1등급컷 2개, 2등급컷 1개 등 3개를 적중해 대성 비타에듀와 동일한 수를 맞혔지만, 등급컷 오차의 격차가 매우 큰 컸다는 점에서 분석력에 문제가 심각하다는 평을 피하기 어려웠다. 6월모평에서 최저의 분석력을 드러냈다가 9월모평에서 가까스로 명예회복에 성공했던 종로하늘이 다시금 10월학평에서 상대적으로 뒤떨어지는 분석력을 드러낸 것이다. 단 1개의 등급컷도 맞히지 못한 스카이에듀가 10월학평에서 최저의 분석력을 보인 기관이라는 점은 자명한 사실이었지만, 종로하늘도 만만치 않았다는 평가다. 
 
 영역별로 실제 등급컷 점수와의 오차가 제일 큰 기관들을 따져본 결과 종로하늘의 급락한 분석력은 상대적으로 뚜렷했다. 종로하늘은 무려 4개영역에서 가장 큰 폭의 오차를 낸 입시기관으로 꼽혔다. 비타에듀가 2개, 메가의 체감등급컷이 2개, 진학사가 1개 영역에서 가장 오차폭이 큰 등급컷을 내놨다는 것을 고려하면 단연 분석이 세밀하지 못하다는 점을 드러낸 것이다. 스카이에듀가 3개로 종로하늘과 비견할만 했지만, 이미 스카이에듀는 단 1개영역의 등급컷도 맞히지 못한 상태란 점에서 비교할 만한 대상은 아니었다. 
 
실제 등급컷을 보면 종로하늘이 낸 오차들은 폭이 매우 컸다. 종로하늘은 10월학평에서 국어와 수학(나) 2등급컷에서 무려 6점씩의 오차를 냈으며, 수학(가) 2등급컷은 4점, 국어 1등급컷은 3점의 오차로 실제 등급컷에서 크게 벗어난 모습을 보였다. 특히 종로하늘은 국어영역 기준 1등급컷과 2등급컷 모두 최대오차를 보인 입시기관이었으며, 수학(나)는 1등급컷에서 1점의 오차에 불과했으나, 2등급컷에서는 6점의 오차로 1등급 새 무려 5점이나 오차의 격차가 벌어졌다. 동일한 수학(나) 영역 1등급컷에서 3점의 오차를 냈던 비타에듀와 스카이에듀는 2등급컷에서는 순서대로 3점, 4점으로 비슷한 오차범위를 유지했다. 종로하늘과 대조적인 모습이었던 것이다. 
 
등급이 내려갈수록 오차범위가 커져가는 모습은 종로하늘이 분석의 기준을 제대로 수립한 것인지에 대해 의구심을 갖게 만드는 대목이었다. 9월모평에서 거둔 성과가 우연의 결과물이 아닌지가 의구심이 들 정도다. 분석 기준이 제대로 수립돼있지 않은 것이거나 분석력이 유달리 저조하다는 결론이 도출될 수밖에 없었다. 
 
종로하늘이 다시금 저조한 분석력을 보인 탓에 업계에서는 올해 수능에서도 종로하늘의 등급컷을 신뢰하기는 어려울 것이란 전망이 제시된다. 지난해 수능 당일 임성호 대표가 수학(B)와 영어의 원점수 1등급컷이 100점이 될 것이라고 밝혔다가 오후7시42분 최초 공시 등급컷을 기준으로 수학(B)는 96점, 영어는 92점이 될 것이라고 꼬리를 내렸던 전례가 되풀이되는 일만은 막아야 한다는 충고도 나왔다. 한 업계 전문가는 “비록 10월학평 기준 저조한 분석력이란 평가지만, 9월모평에서 보여준 종로학원의 분석력은 상당한 수준이었다. 수능날 심혈을 기울여 분석한다면 괜찮은 결과물을 낼 수 있을 것으로 보인다. 문제는 임 대표의 언행이다. 하늘교육이 고입시장에서 성장한 탓에 실제 대입 관련 분석 등은 하늘교육에 인수된 종로학원 관계자들이 하는 것으로 알고 있다. 지난해 임 대표가 언론에 나서 ‘종로학원 강사들의 의견’ 운운한 것이 다시 되풀이돼 등급컷 분석을 맡은 종로학원의 이미지만 망치는 것이 아닐까 걱정된다”고 우려했다. 
 
<절반 이상 맞히는 데 성공한 5개기관>
등급컷 6개를 맞히며 뛰어난 분석력을 보인 유웨이와 메가스터디, 하나도 맞히지 못해 빈축을 산 스카이에듀와 뒤따라 저조한 분석력을 보인 종로하늘, 종로하늘과 동일한 3개영역 등급컷을 맞혔지만 틀린 영역들에서 오차범위가 상대적으로 적었던 대성과 비타에듀 등 6개기관을 제외한 나머지 5개기관은 4개 이상의 등급컷을 맞히며 무난한 모습을 보였다. 김영일 EBS 비상교육 진학사가 5개, 이투스가 4개의 등급컷을 적중, 비교적 안정적인 분석력을 보였다는 평이다. 
 
굳이 따지자면 등급컷 분석의 기준이 되는 1등급컷을 3개 맞힌 김영일과 EBS가 상대적으로 나은 분석력을 보여줬다고 할 여지가 있었다. 2등급컷 기준 김영일은 수학(나)에서 1점, 수학(가)에서 2점, EBS는 영어에서 1점, 수학(가)에서 2점으로 오차 범위도 크지 않은 편이었다. 뒤를 이은 비상교육과 진학사 중에서는 수학(가) 1등급컷에서 4점의 오차를 보인 진학사가 상대적으로 비상교육에 뒤지는 모양새를 보였다. 
 
<등급컷 적중이 가지는 의미.. 입시기관 신뢰도의 잣대>
입시기관들의 등급컷을 조사하는 목적은 무책임하게 발표하는 등급컷을 사후 검증함으로써 입시기관의 분석력을 면밀히 측정하려는 데 있다. 등급컷 적중도/적중률로 표현되는 적중개수를 통해 입시기관의 신뢰도를 판가름 하려는 것이다. 어느 입시기관의 정보가 정확한지 판단하기 힘들 정도로 난립양상인 교육업계에서 신뢰할 수 있는 입시기관이 어디인지 교육수요자들에게 알리는 이정표이기도 하다. 
 
수능을 비롯해 학평/모평 등 모의고사 당일 발표되는 입시기관들의 추정 등급컷은 인터넷 포털사이트 검색어 순위에 오르내릴만큼 학생/학부모를 비롯한 교육계 전반의 관심거리다. 특히, 교육수요자들은 가채점을 통한 원점수로 자신의 위치를 가늠하기 위해 당일 발표되는 등급컷을 활용할 수밖에 없는 구조다. 교사들도 진학지도 등의 목적으로 등급컷에 주목하곤 한다. 
 
입시기관들이 시험 직후 내놓는 ‘최초’ 등급컷은 채점서비스 참여데이터, 자사 학원생들의 응시데이터 등 기초자료를 활용해 각자 지닌 입시분석기법을 기반으로 예측/추정한 수치다. 때문에 입시기관들의 공력을 가장 뚜렷하게 나타내는 지표다. 입시기관들의 ‘날것’과 같은 생생한 분석력을 평가할 수 있는 유일한 잣대나 마찬가지인 셈이다. 각 기관들의 ‘공력’으로 일컬어지는 분석력과 분석의 베이스가 되는 기관별 데이터의 위력을 방증하는 근거로 보면 정확하다.
 
‘최초’ 발표된 추정 등급컷은 시간이 지나면서 보정되는 과정을 통해 엇비슷하게 변해 기관들의 분석력을 따지는 지표로 활용 불가능하다. 모의 지원자/표본 수가 누적됨에 따라 데이터가 바뀌는 경우가 많으며, 타 기관의 분석을 참고하는 과정에서 수치가 조정되기도 한다. 추후 시험을 주관한 평가원/교육청이 내놓는 수험생 채점/통계자료가 나오면서 등급컷 예측은 의미를 잃는다. 데이터가 공개되면서 입시기관들의 등급컷은 전부 대동소이한 값으로 고정돼 비교할 수단마저 사라진다. 최초등급컷이 입시기관들의 공력을 가르는 지표로 활용되는 이유다. 
 
베리타스알파는 교육수요자들에게 영향력이 큰 입시기관의 신중하고 냉철한 대응을 당부하는 차원에서 2014 수능부터 기관별 추정 등급컷의 신뢰도를 따져왔다. 상당수 입시기관들이 언론과 수요자들의 관심을 끌기 위해 신중하고 정확하게 수치를 내기보다는 빨리 발표하는 데만 매몰돼있는 행태를 방지하기 위해서다. 물론 입시기관 중 신뢰할 만한 곳이 어디인지 수요자에게 판단할 수 있는 정보를 제공하려는 목적도 더해진다. 올해 진학사가 실제 등급컷 적중률이 ‘꼴찌’에 불과했음에도 '업계 최다 적중‘이라고 홍보하는 등 수요자 기만행위를 펼친 것이 대표적인 예다. 베리타스알파는 앞으로도 학평과 모평, 수능 당일 입시기관들이 최초 발표한 등급컷의 신뢰도를 측정할 예정이다.
 
 
  
 
 
본 기사는 교육신문 베리타스알파의 고유 콘텐츠입니다.
일부 게재 시 출처를 밝히거나 링크를 달아주시고 사진 도표 기사전문 게재 시 본사와 협의 바랍니다.
저작권자 © 베리타스알파 무단전재 및 재배포 금지