본문 바로가기
  • sheshe.tistory.com
학교 이야기/schooling

누구를 위한 평가인가

by 릴라~ 2019. 10. 25.

 

정기고사 기간이 되면 학생 뿐 아니라 교사도 긴장한다. 흔히 객관식이라 부르는 선다형 시험 문항은 자칫하면 출제 오류 시비가 나기 쉽기 때문이다. 작년 중간고사에서 소설 한 문제가 정답이 두 개가 나와 3학년을 맡은 교사 세 명이 경위서를 썼다. 뒤이어 연구부에서 ‘학교장 주의’ 기안을 처리하라고 쪽지가 왔다. ‘공무원 성실 의무 위반’으로 인한 학교장 주의라나.

오지선다형 문항은 출제하는 데는 품이 너무 많이 드는 데 반해 교육적 효과는 별로 없다. 정답을 제외하고 나머지 4개 답지는 틀린 서술이어야 하므로, 교사는 오류가 섞인 문장을 창작하는 데 대부분의 에너지를 쏟는다. 게다가 평균 점수가 80점을 넘지 않도록 하려면 몇 문제를 꼬아야 한다. 이 과정을 반복하다보면 대체 이런 문항들이 얼마나 교육적 의미가 있을까 의문이 생긴다. 국어 과목의 경우 본문 글에 제시된 내용만으로 문제를 풀어야 하므로 학생들의 반응도 매우 제한된다. 확산적 사고가 아니라 철저하게 수렴적 사고를 해야 시험을 잘 칠 수 있다.

몇 년 전, 내가 출제한 문항 중에 소설 배경을 파악하는 것이 있었다. ‘이야기가 간이역에서 시작된다’가 정답인데 쉬운 문제인데도 이 답지를 오답으로 체크한 학생이 많았다. 물어보니 본문에 ‘간이역 "부근"’이라는 서술이 나왔기 때문이란다. 국어 시험을 수학처럼 풀면 안 되고 전체 문맥을 보라고 당부해도 이런 일은 시험 때마다 일어난다. 지식이 아니라 독해력을 묻는 국어 과목은 수업내용과 평가간의 괴리가 벌어지기 쉽다. 선다형 평가는 학생들의 사고를 편협하게 한다는 점에서 국어교육이 지향하는 바와도 거리가 멀다.

시험 문제풀이 위주로만 공부하는 것은 단기적인 효과는 있을지 모르나 학생들이 개념적 사고를 형성하는 데는 전혀 도움이 안 된다. 중학교의 경우 고교보다는 시험에 덜 예민하지만 부모님들의 평가에 대한 지대한 관심으로 학생들의 스트레스는 적지 않다. 70점이나 80점이나 실력에 별반 차이가 없다고 말해도 학생들은 말한다. 집에서는 절대 그렇지 않다고. 10점은 어마어마한 차이라고. 사실 선다형 시험의 경우 두세 문제를 더 틀리면 바로 10점이 내려간다.

85점과 90점이 영어 실력에 무슨 유의미한 차이를 보여줄까. 그저 줄 세우기가 목적일 뿐이다. 중학교는 선다형 문항 하나에 3점, 4점, 5점 정도를 부여하지만, 고교의 경우 동점자 비율을 줄이기 위해 소수점 단위의 배점을 한다. 2.5점, 3.7점 이런 식으로 점수를 부여하는 것이다. 계산만 복잡해질 뿐 교육적 의미는 전혀 없다.

선다형 문항도 역할을 할 때가 있다. '사실적 지식'의 암기 여부를 체크하기엔 괜찮다. 공부할 때 기본 지식의 암기는 물론 중요하다. 하지만 선다형 평가는 통과냐 과락이냐 정도를 평가하는데 적합한 것으로 고차적인 사고력과는 거리가 멀다. 학생의 진정한 실력, 즉 어떤 부분에 강하고 어떤 부분에 약한지도 말해주지 못한다. 학생들을 최저 점수인 10~20점대에서 100점까지 촘촘하게 줄을 세우는데 가장 유용한 평가가 선다형 평가다. 

시험 문제를 오래 출제해 보면 알게 된다. 모든 문항이 동일한 중요성을 갖는 게 아니라는 것을. 25~30개 정도의 문제를 내다보면 상대적으로 덜 중요한 것도 섞이기 마련이다. 논술 혹은 서술형 2~5문제가 출제되는 것과 30개의 선다형 문항이 출제되는 것을 비교해보면 문항의 성격 차이를 짐작할 수 있다. 선다형 문항을 한두 개 더 틀렸다고 해서 실력에 의미 있는 차이가 있는 것이 아니다. 단 한 문제도 놓치기 않으려면 본질적인 물음에 관심을 갖는 것보다 '넓고 얕은' 지식을 확실하게 아는 편이 낫다.

창의성의 본질은 무엇일까. 다른 건 잘 몰라도 한 가지는 분명하다. 창의성이란 실수하는 가운데 나온다는 것이다. 새로운 시도는 처음부터 성공하는 게 아니다. 몇 번의 시행착오를 거쳐 좋은 결과가 나올 때가 많다. 한 문제도 틀리지 않고, 실수하지 않으려고 긴장하는 학습태도에서 창의성은 나오지 않는다. 오지선다형 시험은 창의성과 가장 거리가 먼 평가이다. 교육적 관점에서 본다면 중등교육에서는 선다형보다 서술형, 논술형, 구술평가가 훨씬 바람직하다. 대부분 선진국이 그렇게 평가한다.

서술형, 특히 논술형 평가는 채점에는 많은 시간이 걸리지만, 학생들의 앎의 수준이 직접적으로 드러난다. 학생들의 사고 과정이 어느 부분에서 막혀 있고 어느 부분에서 활짝 전개되는지 보인다. 교사가 적절한 피드백을 줄 수 있다. 하지만 선다형 평가는 문제 출제에 대부분의 에너지를 빼앗기는 반면 그 결과는 특정한 교육적 의미를 주지 못한다. 교사가 문항에 실수가 없도록 검토에 검토를 거듭하지만 결과는 단지 숫자로 된 시험점수일 뿐이다. 

이렇게 한 학기에 두 번의 지필 시험을 치르면(서울은 한 번이라 하지만 대구는 아직 대부분 2회를 치른다) 6주 정도 교사는 가르침보다는 문제 출제에 온통 신경이 가 있다. 학생들도 학원 보충에 이것저것 챙기느라 시험 전후 2주간은 수업 집중력이 떨어진다. 시험을 치고 나서는 긴장이 확 풀려서 또 수업 분위기가 나빠진다. 한 학기에 한 달은 수업 리듬이 깨지는 셈이다. 교사도 학생도 배움 그 자체보다 다른 일로 더 바쁘다. 평가는 교육활동의 일부로 존재해야 하는데, 지금은 평가가 가장 중요한 임무가 되어버렸다.

선다형 평가의 단점을 보완하기 위해 교육청은 수행평가를 도입했고 최근에는 서술형 문항을 의무적으로 30퍼센트 이상 출제하도록 했다. 하지만 이는 교사와 학생 모두를 더 바쁘게 만들었다. 학기당 2회의 지필고사를 그대로 둔 상태에서 학생들은 각종 수행평가에, 서술형 평가까지 부담만 가중된 것이다. 수행평가도 한 학기에 한 가지만 해서는 안 된다. 교사에게 자율권이 없고 과목당 두세 가지 이상을 하라고 요구받는다. 그러다보니 학생들은 수행평가 시즌이 되면 각 과목 수행평가로 정신이 없다. 평가가 너무 많다 보니 교사가 의미 있는 활동으로 수행평가를 기획하더라도 학생들에게는 그저 ‘노가다’로 다가가기도 한다. 배우는 게 아니라 평가하다가 시간이 다 간다.

어느 것이든 무어라도 하나를 빼야 한다. 서술형 평가는 선다형 평가의 단점을 보완하기 위해 도입되었지만, 정답이 정해져 있어서 객관식의 아류에 불과하다. 물론 몇 자라도 쓰는 것이니 객관식보다야 낫겠지만 서술형 본래의 취지를 살릴 만한 것은 아니다. 서술한다는 것은 내가 지식을 어떻게 소화하고 있는지를 쓰는 것이다. 하지만 ‘나는 이러저러하게 생각하고 해석한다’ 식으로 답하는 문제는 하나도 없다. 채점이 어렵다는 이유에서다. 

어쩌면 이것도 식민지교육의 잔영일지도 모른다. 도올 김용옥 선생은 식민지교육을 다른 건 다 가르치되 독립정신만 가르치지 않는 거라고 말한 바 있다. 국어교육의 관점에서 보면 모든 걸 다 가르치는데 '주어'가 빠진 교육이라고 해야 할 것 같다. 작가의 가치관을 검토한 뒤 그에 대한 내 생각을 이야기하는 것이 서술의 핵심이다. 하지만 우리 교육은 철저히 ‘나’를 배제하고 있다. 배움에서 ‘나’의 관점을 적극적으로 다루지 않으면 아이들의 자아는 교과에서 배우는 내용과 연결되지 못하여 일상적이고 ‘유치한’ 상태에 머물게 된다. 주체성을 키우지 못하는 것이다.

‘독일 교육 이야기(박성숙 저)’에서 의미 있는 부분이 많았지만 특히 인상적인 것은 평가였다. 독어과목의 경우 보통 3문제가 출제되는데 시험 문제의 스타일은 동일하다고 한다. 1번은 텍스트를 이해하였는가를 묻는 문제이고, 2번은 어떤 성향의 작가, 혹은 기자이기 때문에 예문에 제시된 글을 쓰게 되었는지 그 배경 설명을 정확히 할 수 있는가, 단순한 독해가 아니라 시대상과 역사적 사건, 작가의 성향까지 정확하게 알고 그 글을 총체적으로 이해하는가를 평가하는 문제다. 3번은 정치면 정치, 역사면 역사, 문학 작품이면 문학 작품을 보는 자신의 관점과 비판 의식을 보여줘야 한다. 1번은 기본적 독해 능력, 2번은 글을 둘러싼 다양한 맥락 속에서 독해하는 능력, 3번은 자신의 생각을 묻는 것이다.

이 중 가장 중요한 키는 2번에 있고 그래서 점수 배점도 2번이 제일 높다고 한다. 독일에서는 문학작품을 읽든, 역사책을 읽든 수업시간에 교사가 학생들에게 강조하는 내용은 저자가 쓴 글을 액면 그대로 믿어서는 안 된다는 것이다. 그 때문에 시험 준비는 작품과 관련된 시대상은 물론 작가 개인의 인생까지 두루 섭렵하며 깊이 있게 공부해야 한다.

왜 이 작가는 이런 주장을 했을까? 그 배경은 무엇일까? 정치 코멘트라면, 이 글의 정치적인 배경은 무엇일까? 이 기자는 진보적 성향인가 보수인가까지 언급해야 한다. 생각을 깊이 해야만 하는 이런 연습을 독일어, 영어는 물론 정치, 사회 과목에 걸쳐 7~8학년부터 13학년까지 수년 동안 계속한다고 한다. 그런 훈련을 지겹도록 하고 학교를 졸업하므로 아이들은 신문기사를 활자가 주는 의미 그대로 믿지 않는다. 이것이 민주 시민으로서의 역량을 키우기 위한 독일 교육의 근간이다.

우리는 이런 식의 전환을 시도하지 못한다. 그보다 훨씬 반응이 제한된 서술형이나 수행평가도 평가기준이 모호하다고 사람들이 생각하기 때문이다. 하지만 선다형 문항이야말로 평가기준이 불분명하다. 학생들의 점수는 등수를 보여줄 뿐 ‘실력’을 보여주지는 못한다. 70점, 80점, 92점이 과연 무엇을 의미하는지 우리는 알지 못한다. 반면에 수행평가는 ‘질’을 평가할 수 있는 분명한 기준이 있다. 90점이라면 어떤 조건을 지켜서 90점인지 알 수 있다. 예를 들어 문단을 구분해서 쓰고, 비판적 관점을 제시할 것 등의 조건을 충족하면 90점이다. 몇 가지 기준을 제시하고 서술하도록 하면, 결과는 바로 나온다. 우수하거나 보통이거나 부족하거나, 이 셋 중의 하나다.

수행평가 채점을 해보면 개인의 실력은 그리 큰 차이가 나지 않음을 알게 된다. 상중하의 3등급 정도로 나뉘는 게 보통이다. 조금 더 섬세하게 살피면 상 중에 최상이 있고 하 중에 최하가 있다. 이렇게 되면 5등급이다. 이 정도가 적절한 평가라고 생각한다. 10점 대에서 100점까지 한 줄로 세워질 만큼 아이들의 실력이 차이나지 않는다. 평가가 촘촘하다고 해서 객관적이고 공정한 평가는 아니다. 프랑스는 3등급, 독일은 5등급, 북유럽 대부분 국가가 3등급으로 평가하고, 그 옆에 아이의 발달 상황을 줄글로 상세히 안내한다.

서술형 혹은 수행 위주의 3등급 혹은 5등급 척도의 평가가 바람직한 이유는 수업시간에 성실하면 누구나 ‘중’ 이상의 점수를 받을 수 있기 때문이다. 수업시간에 잘 참여하지 않고 과제를 제출하지 않으면 ‘하’를 받을 수밖에 없다. 또한 수행평가는 역전이 가능하다. 선다형 평가에서는 아무리 열심히 해도 동급생보다 항상 뒤지는 점수를 받는 친구들이 있지만, 수행평가에서는 잘 못했던 학생이라도 성실하게 참여하여 좋은 점수를 받기도 한다.

국어 말하기 평가를 할 때 있었던 일이다. 평가기준을 제시하고 어떻게 발표하면 좋은 점수를 받을 수 있는지 설명해주고 수행평가를 시작했다. 말하기 원고도 수업 시간에 쓰고 전과정을 수업 시간에 진행했다. 모든 아이들이 열심히 참여했는데 90점, 100점을 맞을 희망이 있기 때문이다. 학생들이 발표를 너무 잘하여 우리 반 학생 절반이 100점을 받은 적도 있다. 발표에 익숙치 않은 학생은 당황하여 못할 수도 있으므로 자기 점수에 만족하지 못하는 학생에게는 재도전의 기회를 주기도 했다. 전교에 두 명이 새로 준비해서 발표를 했고 실수가 교정되어 더 나은 점수를 받았다.

점수를 일부러 잘 주는 일은 있어서는 안 되지만, 학생들이 성실히 공부해서 다 잘하는 것은 좋은 일이다. 하지만 선다형 지필평가의 경우 평균 80점을 넘지 않아야 하고, A가 많이 나오면 안 된다(교육부 지침은 그렇지 않다고 하는데 교육청에서는 A가 20퍼센트를 넘지 않기를 요구한다). 좋은 학군에 위치한 학교의 경우, 학원을 통한 철저한 시험 대비가 이루어져서 문제를 꼬아서 내지 않으면 평균 80점은 금방 넘는다. 그래서 어떤 지역에서는 중학교 시험문제가 불필요하게 어려워지는 경우도 있다.

다만 수행평가는 적절한 평가가 되어야 한다. “이게 국어수업인지 미술수업인지 모르겠어요”라는 하소연이 교사들에게 나올 만큼, 지나치게 보여주기 식의 평가가 많다. 호기심, 자신에 대해 성찰하는 힘, 역사의식, 공적인 감각, 독창성, 참신한 아이디어, 예술에 대한 관심, 자연에 대한 사랑, 우정, 지식의 가치에 대한 신뢰 등이 일깨워지는 활동일 때 의미가 있다. 그리고 수행평가가 ‘가문평가’가 되지 않도록 하려면 학교에서 모든 과정을 안내하고 학생들을 참여시켜야지 과제 형태로 주어서는 안 된다. 평가자의 전문성에 대한 신뢰가 있고 적절하게 구성된다면 수행평가는 지필평가보다 교육적 장점이 많다.

교육청에서는 협력학습을 강조하며 모둠평가를 강화하라 하지만 모둠평가를 해보면 알게 된다. 성적에 민감한 학교의 경우 아이들이 협력하는 게 아니라 더 멀어진다는 것을. 내신이 고등학교만큼 중요하지는 않은 중학교에서도 모둠평가를 한다고 하면 아이들이 갑자기 누군가를 배제하는 모습을 보일 때가 있다. 평소엔 잘 지내지만 같은 모둠이 되기는 싫은 것이다. 그만큼 아이들은 점수에 민감하게 반응한다. 

우리 반 학생이 말하기를, 모둠 구성원 모두가 잘 참여해도 결국 자기가 다 하게 된다고 했다. 결과물이 불안해서 자기가 하는 게 더 낫기 때문이란다. 이렇게 친구들을 무임승차 시키는 경우를 아이들은 ‘버스 태운다’고 말한다. 더 심한 경우는 ‘비행기 태운다’ 라고 한다. 우리 반 녀석 말로는 버스를 태우고 싶은 욕망을 결코 버릴 수가 없단다. '협동'을 위해 고안된 모둠평가가 교육적 의도와는 정반대의 결과를 낳는 것이다. 점수에, 평가에, 서열에 우리 사회 구성원들이 얼마나 길들여져있는지를 바탕에 깔고 이 모든 것을 바라보아야 한다. 

마지막으로 기억해야 할 것이 있다. 평가를 아무리 잘 구성한다 해도 평가할 수 없는 부분이 더 많다는 것을. 평가에 대한 강박증에서 벗어나야 한다. 글쓰기와 구술이 선다형 문항보다는 배움의 결과를 좀 더 섬세하고 심도 있게 보여줄 수 있다 해도 평가에는 언제나 한계가 있다. 그러므로 당연한 말이지만 평가보다 수업이 중요하다. 하루하루의 수업에서 알찬 배움이 이루어지고 성장이 이루어지도록 교육과정을 운영해야 한다. 그리고 궁극적으로는 자기가 자기를 평가할 수 있어야 한다. 그건 학생이 배움이라는 활동의 주체가 될 때 가능하다.

배움의 마지막은 느낌을 갖는 것이다. 객관식 선다형 평가에는 ‘느낌’이 제거되어 있다. 내가 무엇에 호기심을 느끼고 감동하고 매혹되고, 어떤 생각과 질문을 새롭게 일으켰는지와 전혀 상관 없는 평가이다. 그 모든 것을 몰라도, 아무 느낌이 없어도 풀 수 있는 문제이다. '느낌'이야말로 배움의 의미, 우리가 살아가는 의미와 직결된 것인데도! 그래서 많이 배울수록, 문제풀이를 많이 할수록 ‘나’는 사라지고 내 생각도 없다. 지식을 소화하고 이해하고 응용하는 주체는 ‘나’다. 이 ‘나’가 대중 속에 용해될 때 사회는 위험해진다. 인공지능 시대일수록 개인의 주체적인 목소리는 더 소중하다.

관찰, 통찰, 사유, 질문, 창의성, 이 모두 지식의 차원이 아니라 '인격적' 차원에서 이루어지는 활동이다. 지금보다 한 단계 수준 높은 교육, 생각하는 힘과 사랑하는 힘을 바탕으로 한 '지적 도전'을 경험하게 하려면 평가를 둘러싼 패러다임을 바꾸어야 한다. 특히 한국의 교육은 평가가 다른 교육활동을 지배하고 삼켜버린 형국이기 때문에 평가를 바꾸는 일이 교육을 바꾸는 가장 빠른 길이 될 수도 있다.

패러다임을 바꾸는 일은 굉장히 어려운 일이다. 어렵기 때문에 지금까지 하지 못했다. 객관식 선다형, 서술형, 수행평가, 모든 게 섞여 이도 저도 아닌 지금의 혼돈에서 벗어나 분명한 방향을 세울 때다. 우리가 변화를 실현해낸다면 우리 사회는 한 발 앞으로 전진할 것이다. 그 반대의 경우라면 정체와 퇴보를 피할 수 없다. 교육은 물론이고 사회의 모든 분야에서 우리는 그런 기로에 서 있다.

 

*수능 확대 뉴스를 보고 덧붙임

1. 내신이든 수능이든 무조건 상위 20퍼센트 내의 경쟁이다. 그 안에서 자신에게 더 유리한 전형을 찾는 것(내신 2~3등급이 수능으로 1등급으로 치고 올라가기를 희망). 5년 전, 내가 근무했던 일반고에서 절반 이상의 학생이 수능문제풀이 보충수업을 따라오지 못했다. 1학년 모의고사에서 400점 만점에서 200점을 못 넘기는 학생이 대다수. 수능 문제풀이 수업은 80퍼센트의 학생들을 버리는 것.

2. 자사고, 외고 없애도 아무 소용 없다. 강남 8학군과 대구라면 수성 학군이 그 자리를 대신 차지할 것인데. 지금도 격차가 크지만 수능 체제로 전환되면 그 격차는 어마어마하게 벌어질 것이다.

 

300x250

댓글