미국의 수행평가 사례와 시사점
김영천 / 진주교육대학교 교육학과 교수 싸이월드 공감
Ⅰ. 또다시 떠오르는 수행평가
1990년대 한국사회를 혼란으로 몰고간 수행평가가 다시 학교현장의 중심에서 더욱 활발히 적용될 계획이라고 한다. 아마도 그 당시를 살았던 교육학자, 교육자, 학부모와 교사들 그리고 학생들이라고 한다면 이 단어가 얼마나 우리의 학교와 교사들 그리고 전국의 학부모, 심지어 전국 주요 일간지의 중요한 관심사가 되었는지는 쉽게 기억해 낼 수 있을 것이다. 모두가 준비가 되지 않았던 그 시절. 수행평가는 우리의 교육정책에서 멀어졌고 교육부를 포함한 대부분의 교육학자들과 교육자들은 수행평가의 단어를 포기하기에 이르렀다. 필자 역시 의도하든 의도하지 않았든 간에 2000년 이후에 진주교육대학교에서 선택으로 있었던  ‘교육평가’ 과목을 다른 교수님에게 넘겨주면서 연구에서 멀어질 수 밖에 없었다. 그리고 어쩌다 한번   ‘교육과정’ 수업에서 성취기준이나 한국 학교교육의 문제점들을 지적하는 방법으로서 수행평가를 간략하게 소개하고 있을 뿐이다.

그렇게 하여 약 15년이 흘렀고 다시 교육부가 중학교를 시작으로 수행평가를 전면 시행한다고 발표하였다. 필자가 살고 있는 경남의 교육청 역시 수행평가를 전향적으로 시행할 것이라고 저녁 뉴스에서 보도하고 있다. 이상적으로는 잘된 결정이라고 생각하지만 과거의 실패 경험을 우리가 반성하고 더 나은 계획을 갖고 있는가에 대해서는 다소 회의적이며 많은 걱정이 앞선다. 아울러 이번 만큼은 교육부와 시·도교육청 그리고 한국교육과정평가원과 한국교육개발원에서 체계적으로 그리고 학문적으로 잘 준비하여 또 다른 실패가 없었으면 하는 바람이다. 그러한 점에서 이 글에서 필자는 보다 성공적인 계획과 시행을 위해 우리가 염두에 두어야 하는 주요한 이슈들은 무엇인가에 대해 미국 수행평가의 실태와 한국적 적용 경험을 근거로 하여 논의하고자 한다.

Ⅱ. 미국 수행평가의 실태
교육과정과 수업 전공자라고 한다면 미국과 구미의 1980년대 후반의 성취기준에 기초한 교육개혁/교육과정 개혁에 대해 잘 알고 있을 것이다. 클린턴 행정부로부터 강화된 이 개혁은 미국이 다시 세계 제1의 국가가 되기 위해 어떤 인간자원을 만들어야 하는지를 미국 노동부의 보고서에 기초하여 학교교육을 바꾸어야 한다는 새로운 내용을 담고 있다. 그리하여 제1차 산업과 제2차 산업은 아시아와 아프리카의 국가들에 의존하고, 대신에 국가경쟁력 제고와 고부가가치 상품을 만들 수 있는 인간자원은 미국의 학교가 준비해야 하며, 그 가장 중요한 추진 전략 중의 하나가 바로 학교에서의 평가방법을 양적평가에서 질적평가 그리고 수행평가로 바꾸어야 한다는 정책이었다. 이 과정에서 학교의 교육과정, 수업, 그리고 수행평가가 일련의 연결고리로서 유연하게 이루어질 수 있도록 각 교과의 성취기준을 새롭게 정비하는 작업을 각 교과의 전문가들과 학회차원에서 만들어질 수 있도록 많은 지원과 연구가 이루어졌다. 아마도 우리나라의 학교교육의 성취기준들 역시 이 방향과 내용에 상당부분 영향을 받은 것으로 알고 있다.

그리고 이러한 새로운 수행평가의 접목과 강조로 인해 미국의 많은 학교들에서 수행평가를 이해하고 적용하고 나아가 개발하는 노력들이 이루어졌고 이러한 평가 개혁학교들은 교육학 분야의 대표적인 학술지들에 계속 보도되었다. 이에 발맞추어 AERA와 ASCD 등에서는 거의 10여 년 이상 동안을 이 수행평가와 관련된 주제를 가지고 중점적으로 많은 연구와 세미나 그리고 교사연수들이 이루어졌다. 그 결과 과거에는 찾아보기 힘든 새로운 형태의 평가방법 그리고 수업방법을 개척한 학교들이 나타났고 전국적인 각광을 받게 되었다. 그리고 우리들에게는 최근 익숙해진 수행평가 방법들인 포트폴리오, 루브릭, 컨퍼런스, 자기평가, 전자포트톨리오, 졸업수행평가, 수행평가에 기초한 새로운 성적표 개발 작업 등이 전국적으로 이루어졌다.

그러면서 전국적으로 두각을 나타난 주(state)들의 수행평가 개혁들이 세계의 관심을 받게 되었다. 그 대표적인 몇 개의 주들이 Colorado, Maryland, Kentucky, California, NewYork이다. 특히 수행평가와 Backward Curriculum Design으로 유명한 Grant Wiggins 박사가 있는 New Jersey 주는 Class 연구소와 협력하여 다양한 형태의 교과목 수행평가를 개발한 지역으로 유명하다. 필자가 1998년 이 연구소와 이 연구소가 추천해 준 학교들을 방문했는데 교육과정 학자로서 처음 접한 다양한 방식의 교과 평가방법들에 매우 놀라지 않을수 없었다. 어느 초등학교 교사의 경우, 왜 그렇게 힘든 일을 하느냐라는 필자의 질문에 한 학생, 한 학생의 글쓰기 작품을 읽고 내가 피드백을 줄 때 만이 각 학생이 진보할 수 있고 의미있는 학습의 발달이 가능하다고 말해 주었다. 주말에 쉬지 않고 초등학교 학생들의 글쓰기 과제들을 한아름 집으로 가져가는 그 교사의 일상으로부터 Wiggins 박사가 강조한 평가자로서 교사의 새로운 역할이 무엇인지를 직접 경험할 수 있었다.
이외에도 일리노이중학교 어느 생물 수업에서 있었던 실제 과일 주스의 내용물을 가지고 하는 ‘당과 칼로리의 계산과 추출’ 수업이라든지, 뉴욕 주의 어느 고등학교 3학년의 발표를 통한 졸업자격 평가 행사(Graduation by Exhibition)는 필자에게는 익숙하지 않은 것이었지만 그 과정 속에서 우리가 강조해 온 진정한 학습, 그리고 진정한 평가가 무엇이어야 하는지에 대한 직접적인 교훈을 얻기에는 충분했다.

미국의 전체 학교들의 평균적인 변화를 객관적으로 제시할 수 없지만 필자가 미국의 현장을 방문한 1990년대 말과 2000년대 초까지만 해도, 학생들의 질적 수준과 능력을 평가하는 도구로서 루브릭이 많은 교과들, 특히 언어와 사회와 인문학/사회과학 교과들에서 널리 쓰이고 있었다. 나아가 학생들의 작품이나 작업의 결과(글쓰기, 실험, 수학문제 풀이 등)들을 모아둔 포트폴리오들이 다양하게 활용되고 있었다. 이러한 학생들의 수행의 결과들을 공식적 평가로 어떻게 연계시킬 것인지에 대해 나름대로 학교차원에서 그리고 주 차원에서의 기준과 방향이 설정되어 있어서 우리나라처럼 많은 쟁점과 의문들을 만들어 내지는 않고 있었다. 아마도 거의 15년이 지난 2016년의 미국과 캐나다 그리고 선진국에서의 수행평가는 더욱 확산되어 있을 것이라고 생각하고 그러한 수행평가를 통해 이 학생들은 더욱 진정한 학습, 진정한 피드백, 그리고 진정한 학습에서의 진보를 경험하고 있을 것으로 생각한다.

Ⅲ. 왜 수행평가인가?
왜 미국 그리고 구미의 학교, 교육학자, 학교개선을 주장하는 연구자들이 수행평가를 해야 한다고 주장하는지, 그 목적에 대해 우리나라의 교육학자 및 교사들 그리고 정책가들이 더욱 진지하게 생각해 볼 필요가 있을 것이다. 그러한 점에서 구미의 여러 교육개혁과 교육과정 개혁, 수행평가에 기초한 학습자 평가방법의 변화 등을 연구해 온 필자는 이 기초적인 인식의 변화가 수행평가와 관련하여 가장 먼저 선행되어야 한다는 생각을 한다. 그러한 이해가 있을 때만이 지난 20여 년 전에 있었던 수행평가 포기의 기억을 바꿔 놓을 수 있고 다시 새롭게 강조되고 있는 수행평가의 실천에 따른 다양한 형태의 오해와 저항, 그리고 반대가 해결될 수 있을 것으로 생각한다.

이에 이 글에서는 교과서적 내용이기는 하지만 필자의 공부, 실제 구미 학교들에서의 방문 경험 그리고 교육대학교의 실제 학생들의 수행평가 작업 평가 경험, 아울러 진주교육대학교 부설 초등학교와의 4년간의 한국 초등학교에서의 수행평가 도구 개발 프로젝트의 실행연구 경험에 기초하여 그 의미를 전달하고자 한다. 투자에 비해 얻는 것이 별로 없다는 어느 미래학자의 한국교육의 저생산성 문제를 굳이 빌리지 않는다고 하더라도 전세계적으로 많은 공부를 하고 있는 학생들, 많은 시험을 치르고 있는 학생들에게 그들의 공부, 수업, 과제하기 등이 진정으로 의미 있는 것이고 그들의 교육적 발달과 국가 경쟁력 제고에 기여하고 있는지에 대해 우리 모두 진지하게 고민해 보아야 한다. 또한 이 질문에 대한 충분한 이해와 공감이 필요할 것으로 주장하고 싶다.
첫째, 교육학적 연구들을 통해 학교교육의 대표적인 평가방법으로 활용되어 온 지필평가와 객관식 평가 방법은 수업의 질을 떨어뜨리는 것으로 보고되고 있다. 오직 시험에 나올 내용, 시험에 답할 내용만을 공부함으로써 학생들의 주요한 관심이 진정한 이해가 아니라 단순 암기와 지식의 습득으로 인해 학습의 수준이 추락한다고 한다. 교사들 역시 책무성과 교사평가의 이유로 인해 시험에 나올 내용, 시험문제를 잘 풀 수 있는 방법만 가르침으로써 굳이 지필평가에 나오지 않는 고차원적인 사고 기술이나 문제해결력 등을 굳이 가르칠 필요가 없다.

둘째, 고부가가치 상품을 만들어 낼 수 있는 능력은 오직 수행평가를 통해서만 길러지고 강화된다. 우리가 우리의 미래 학생들에게 그러한 능력을 길러주기를 원한다면 그러한 과정과 능력을 평가할 수 있는 평가 도구와 방법을 실행해야 할 것이다. Bloom, Marzano, Anderson 등이 개념화한 학교교육의 상위 학습의 결과로서 고등사고 기술들은 지필평가방법을 통해 확인하기도 어렵고 평가하기도 어렵다. 우리가 이상적으로 생각하는 고차원적 기술, 부가가치 상품을 만들어 낼 수 있는 사고기술들인 적용, 분석, 종합, 비평, 문제해결, 의사결정, 실험탐구. 새로운 의사소통의 창안, 새로운 조작절차의 개발과 설계, 새로운 조직원리 등의 개발 등이 수행평가 방법을 통해 촉진되고 확인될 수 있다.
셋째, 인간의 지능과 지적능력에 대한 개념이 달라졌다. 아는 것과 행하는 것은 다르며 많이 안다고 하여 잘 만드는 것은 아니라는 점이다. 무언가를 잘 알고 있고 이해하였다면 구체적으로 그 무엇인가를 만들 수 있어야 한다. 미국과 구미의 수행평가 실천을 이론적으로 제공해 준 하버드대학교의 인지심리학자이자 교육학자인 Howard Gardner(1993)의 다중지능이론의 지능에 대한 개념이 이를 잘 설명하고 있다. 지능은 지필평가처럼 무엇을 잘 기억하고 인출하는 능력을 확인해서는 안 되며 구체적으로 자신이 알고 있는 개념을 실제의 문제해결과정에서 그 어떤 무엇(생산품)으로 만들어 낼 수 있는 능력이어야 한다는 것이다. 이해하였다면 구체적으로 이를 수행으로 드러내야 하며 드러낼 수 없다면 이는 알지 못한다는 것이다. 수학의 함수 개념을 이해하였다면 함수와 관련된 실제 문제를 해결할 수 있어야 한다. 통계, 보험 또는 로켓 발사나 집 안 정원의 분수를 직접 설계할 수 있어야 한다. 가끔씩 진주교육대학교 2학년 학생들을 대상으로 수업시간에 다음과 같은 퀴즈를 낸다. LA의 한국인 투수 류현진 선수의 코치라고 가정하고 투수의 무덤이라고 하는 Colorado의 Coors 야구 경기장에 가기 전 홈런을 맞지 않도록 하는 방법에 관한 조언의 편지를 한 장 정도 직접 작성하는 것이다. 평지와는 다른 해발 2,000m가 넘는 로키산맥에서 투수들이 평소와 다르게 어떻게 던져야지 홈런을 맞지 않을 것인지에 대해 그 해결책을 제시해야 한다. 고등학교 어떤 교과, 어떤 단원, 어떤 개념을 배우고 났을 때 이 수행과제를 제시해 줄 수 있는지 추가적으로 묻는다. 기대와는 다르게 해결책을 제시해 주는 학생들은 별로 없다.

넷째, 수행평가는 인간의 성공에 가장 필요한 지적 작용인 ‘지적 지구력’을 강화시켜준다. 짧게는 하루 전 길게는 며칠 공부하여 준비하는 지필평가와는 달리 수행평가는 이보다는 장기간 준비를 하여 과제를 제출한다. 한 과제에 몰입하여 해결책을 찾는 과정에서 과제집중력이 길러지고 동기와 다양한 정서적 특징들이 길러진다. 에디슨이 말한 것처럼 그리고 노벨상 수상자들의 삶이 그렇듯이 대부분의 발명품과 이론들의 개발은 장기간의 외로운 자기와의 싸움이다. 고민하고 실험하고 실패하고 다시 도전한다. 지구력이 없이는 끝낼 수가 없고 성공하기 어렵다. 마라톤을 끝내기 위해 엄청난 근력이 요구되는 것처럼, 우리의 일상적 지적과제와 활동 역시 지적 지구력이 있을 때만이 좋은 과제를 만들 수 있고 목표에 도달할 수 있다. 그리고 그러한 기능이 바로 오랜 시간을 들여 과제해결을 해야하는 수행평가를 통해 길러지는 것이다.

Ⅳ. 우리 학교현장에 주는 시사점
이 분야를 오랜 동안 대학에서 그리고 학교 현장에서 연구해 온 연구자로서 수행평가가 다시 학교현장에 실행된다는 소식에 다행스럽다는 생각과 함께 걱정이 앞선다. 그리고 그러한 걱정은 지난 15년에 비해 수행평가를 학교현장에 적용하는 실제적인 문제와 관련하여 우리의 교육학계와 학교현장이 더욱 철저한 준비와 계획을 해야 한다는 생각을 한다. 이에 이 글의 마지막 내용으로서 우리 학교현장에서의 성공적 적용을 위해 미국 수행평가의 실제 이해가 주는 시사점이 무엇인지를 다음과 같이 제시하고자 한다.

첫째, 수행평가는 교육평가의 영역이라기보다는 교육과정과 수업영역이라는 점이 선행되어야 한다. 그러한 점에서 국내수행평가의 초기 연구자들이 대부분 교육평가 연구자들이거나 아이러니하게도 양적평가 중심의 연구자들이라는 점은 그다지 바람직스럽지 않았다. 양적으로 측정되기 힘든 인간의 다양하고 복잡하며 내면적인 학습의 과정이나 특성 그리고 그 가능성들을 강화시키고자 하는 수행평가는 학습자에게 새롭게 요구되는 교육목표들과 학교교육의 방향들을 잘 알고 있고 연구한 교육과정 학자들, 그리고 수업이론 학자들이 더욱 전문적으로 연구해야 하는 부분이다. 그러한 이유 때문에 수행평가는 단순히 양적평가와 대비되는 평가방법의 문제가 아니라 새로운 고차원적인 인간을 양성하려고 하는 선진국의 새로운 학교교육혁신 프로젝트이며 이념이기도 하다. 따라서 수행평가는 고차원적인 사고기술과 학습태도를 길러내기 위해 만들어진 성취기준(Standard-based curriuclum reform), 수업, 그리고 평가가 어떻게 조화롭게 이루어져야 하는지를 잘 알고 있는 전문가가 더 효과적으로 설계할 수 있다. 앞으로 수행평가와 관련된 연구나 실행에 있어서 수행평가는 교육과정과 실제 수업의 밀접한 연계 속에서 이루어져야 한다. 교과와 단원의 목표, 달성하려고 하는 사고의 기술, 이와 관련된 수업의 방법과 과제의 개발, 그리고 평가까지의 단계가 모두 사려 깊게 개발되어야 한다.

둘째, 수행평가와 실기평가가 구별되어 활용되어야 한다. 음악, 미술이나 체육과 같은 기능이나 활동과 관련된 평가는 수행평가의 근본적인 목적과 부합되지 않는 다는 점을 명료하게 해야 한다. 단지 그것이 수행이라고 하여 학교현장에 널리 쓰임에 따라 수행평가가 고행평가라는 잘못된 인식을 심어 주었다. 이러한 구별이 보다 명료하게 될 때, 학교현장에서 수행평가의 양과 횟수로 고통스러워 하는 학생들과 교사들의 업무 양이 줄어들 수 있다. 또한 교사, 학부모, 신문기자나 방송인들에 대한 고객친화적인 안내가 필요하다. 아직까지 수행평가와 관련하여 저녁 뉴스에 체육의 기구 활동이나 미술의 만들기 장면이 수행평가의 예로 제시되는 것은 이러한 자명한 예에 속한다. 주로 인지적 교과에 한정하여 수행평가를 실행하고 그 이외의 교과들은 인지교과와 관련된 사고기술이나 학습활동이 있는 경우를 연계시킴으로써 그 양을 조화롭게 만들어야 한다.
셋째, 수행평가의 핵심인 수행 과제나 활동을 충분히 이해할 수 있는 교사용 지침서나 활동가이드가 필요하다. 먼저 초등학교용, 중학교용, 고등학교용이 각각 만들어져야 한다. 아울러 대표적 단원들과 교과개념들을 선정하고 이를 어떻게 수행평가로 이어지게 할 것인지에 대해 실천가가 잘 이해할 수 있게 예를 제시해 주어야 한다. 미국과 같은 경우에도 현장교사들이 실제로 수행과제를 만드는 일에 대해 많은 부담을 느끼고 있고 그 능력에도 차이들이 있다고 한다. 따라서 때로는 매릴랜드의 경우, 방학 때 전공 대학교수와 현장교사들이 모여 수행과제를 만드는데 총력을 기울이고 있고 수많은 연구비가 이를 개발하는데 쓰인다. 우리나라의 경우, 아직까지 각 교과별 교사용, 학부모용, 또는 학생용 수행과제나 포트폴리오의 내용이나 형식이 없는 것은 아이러니하다. 어떻게 좋은 수행과제를 만들 수 있는지, 그리고 어떤 과제가 좋은 수행의 과제인지를 현장교사들이 충분히 이해할 수 있도록 국가 교육과정의 범주 안에서 다양하고 충분하며 세밀한 과제들을 많이 만들어서 직접 또는 변형하여 활용할 수 있도록 해야 한다.

넷째, 학교차원이나 국가차원에서 어떤 교과에서 얼마나 많은 양의 수행평가를 한 학기 또는 일년 단위로 해야 할 것인지를 친절하게 알려주고 공지해 주어야 한다. 그렇지 않을 경우, 각 교과나 단원마다 수행평가를 실시할 수 있어서 모든 교과 수업을 총합하였을 때 개별 학생이 한 학기 수업에서 해야 할 수행과제의 양은 능력 밖으로 많아질 수 있다. 아마도 이 문제가 15년 전 우리나라의 수행평가가 실패로 끝난 중요한 이유가 되지 않았나 생각한다. 교육부가 이를 기준으로 제시할 수 없다면 각 학교 차원에서 교장과 교과 교사들이 모여서 적절한 양과 횟수를 협의해 정할 필요가 있다. 단순히 성적표에서 수행평가 몇 %는 그 횟수를 명시하지 않은 것이어서 문제의 소지가 있다. 필자의 개인적 경험으로는 잘 만들어진 수행과제 한개의 경험만으로도 학생은 상당히 많은 지적 경험과 성장을 할 수 있을 것으로 생각한다.
다섯째, Grant Wiggins 박사의 수행평가 이론서들에게 강조하고 있듯이 이제 교사를 가르치는 사람으로 간주하기보다는 평가자로서 간주하고 훈련시켜야 한다고 하였다. 그런 점에서 우리 학교현장의 교사들은 평가전문가로서 활동하고 성장하는 데 교사직전기관의 교육적 경험이 충분한 것은 아니었다. 교직과목에 교육평가 과목을 한 과목 수강하기는 하지만 대부분 양적평가나 측정 관련 지식을 배우기 일쑤이고 많은 교직과목에서는 교육과정과 통합하여 한 과목을 듣는다. 그만큼 수행평가와 관련한 직접적인 수강 경험이 없는 실정이다. 그러한 점에서 필자는 교직관련 교육대학교와 사범대학에 교육평가라는 과목 대신에 ‘교실평가’ 또는 ‘학습자평가’라는 이름의 대안적 평가를 주로 하는 과목이 신설되어야 한다고 믿는다. 학생들의 과제나 글쓰기, 발표, 실험보고서 등을 질적으로 이해하고 평가하며 어떤 피드백을 주고 어떻게 그 결과를 기록할 것인지에 대한 지식을 이러한 과목을 통해 배워야 할 것이다.

여섯째, 교사들의 업무의 특징을 잘 이해할 필요가 있다. 필자의 많은 현장연구의 결과, 이상적으로는 필요하지만 실제적으로 고통이 따르는 혁신적 과제나 일에 대해 교사들이 그다지 적극적이지 않다는 점이다. 더 많은 과제나 업무에 대해 어떤 외적 보상을 제공해야 하는지에 대해 교육부가 생각해야하고 이를 구조적으로 정착시킬 수 있는 다양한 방법들을 찾는 노력이 필요하다. 특히 지필평가를 평생 받아왔고 익숙하고 편안함을 느끼는 교사들을 설득시키고 변화시키고 자신들의 전문적 생활(교육과정 설계, 수업방법, 학습자평가 등)에 직접적으로 연계시킬 수 있게 하는 것은 매우 어려운 국가적 과제가 될 것이다.
참고문헌
김영천(2007). 현장교사를 위한 교육평가. 서울: 문음사.

김영천 외(2001). 초등학교 수행평가. 서울: 박이정.

김영천(2005). 미국의 수행평가. 서울: 문음사.

Garnder, H.(1993). Multiple Intelligences: the theory in practice. NY: Basic Books.

Wiggins, G.(1998). Educative Assessment. San Franciso: Jossey-Bass.
▲ TOP 싸이월드 공감
서울특별시 서초구 바우뫼로 1길 35(우면동) 한국교육개발원 keditor@kedi.re.kr Tel.02-3460-0319 Fax.02-3460-0151
Copyright ⓒ 2011, KEDI. All Rights Reserved.