그누보드 캡차 인식 프로젝트 - Part 2

이전 글에서는 KCAPTCHA 캡차 프로그램을 깨는 Tensorflow 모델을 개발하는 과정을 다루었습니다.

이번 글에서는 완성된 파이썬 Tensorflow 모델을 Tensorflow.js 레이어로 변환하여 브라우저에 배포하여 서빙하기까지의 과정, 그리고 그 과정에서 발생한 이슈에 대해서 살펴보도록 하겠습니다.

🌐 Tensorflow.js란?

Tensorflow.js는 Tensorflow 팀에서 공식 개발하는 자바스크립트 머신러닝 라이브러리입니다.

Tensorflow.js를 사용하면 Node.js나 브라우저 환경에서 완성된 머신러닝 모델을 실행하거나, 새로 모델을 학습시킬 수 있습니다. WebGL을 통하여 GPU 자원 또한 활용할 수 있습니다.

🔛 모델 변환

Tensorflow.js는 Keras가 사용하는 HDF5 포맷과, Tensorflow가 네이티브로 사용하는 SavedModel 등의 포맷을 Tensorflow.js 레이어로 변환하는 tensorflowjs_converter 커맨드를 제공합니다.

이전 글에서 사용한 모델을 HDF5 포맷으로 저장한 뒤, Tensorflow.js 레이어로 변환하도록 하겠습니다.

Keras 모델은 model.save(...)로 저장할 수 있습니다. 다만 저는 학습 과정에서 자동으로 Callback 함수를 사용하여 가장 Loss가 작은 모델이 저장되도록 구현하였습니다.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
...
checkpoint_callback = tf.keras.callbacks.ModelCheckpoint(
    self.save_path,
    monitor="val_loss",
    save_best_only=True,
    verbose=1,
)
callbacks.append(checkpoint_callback)

self.model.fit(
    x=trainset,
    epochs=epochs,
    validation_data=valset,
    callbacks=callbacks,
)
...

Validation Loss가 가장 작은 모델을 save_path에 저장합니다.

1
2
pip install tensorflowjs
tensorflowjs_converter --input_format keras --output_format=tfjs_graph_model model.h5 model_tfjs/

위 커맨드는 model.h5라는 이름으로 저장된 케라스 모델을 Tensorflow.js 레이어로 변환하여 model_tfjs 폴더에 저장합니다. 커맨드 실행 후 model_tfjs 폴더를 살펴보면 model.json 파일과 weight 파일들이 생성된 것을 확인할 수 있습니다.

1
2
3
$ ls model_tfjs
group1-shard1of8.bin  group1-shard3of8.bin  group1-shard5of8.bin  group1-shard7of8.bin  model.json
group1-shard2of8.bin  group1-shard4of8.bin  group1-shard6of8.bin  group1-shard8of8.bin

🙋‍♀️저는 에러가 나는데요?

Tensorflow.js 레이어로 모델을 변환할 시 주의할 점으로, 사용자 정의 레이어, 손실 함수 등을 사용했다면 변환이 되지 않습니다.

이 문제를 해결하는 (정확한) 방법은 파이썬 모델을 변환하는 대신 자바스크립트로 똑같은 모델을 작성해준 뒤, weight만 옮겨서 사용하는 것일텐데요.

저의 경우는 약간의 꼼수를 써서 이걸 해결했습니다. 제 코드에서 문제가 되는 부분은 커스텀 accuracy metric을 사용한 것이었는데, 이 부분은 사실 학습 결과에는 영향을 주지 않는 값이었습니다. Loss만 잘 정의되어 있으면 학습에는 문제가 없으니까요.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
# 문제가 된 함수
def _captcha_accuracy(self, captcha_length, classes):
    def captcha_accuracy(y_true, y_pred):
        sum_acc = 0
        for i in range(captcha_length):
            _y_true = tf.slice(y_true, [0, i * classes], [-1, classes])
            _y_pred = tf.slice(y_pred, [0, i * classes], [-1, classes])
            sum_acc += metrics.categorical_accuracy(_y_true, _y_pred)
        return sum_acc / captcha_length

    return captcha_accuracy

1
2
3
4
5
6
7
8
9
self.model.compile(
    optimizer=opt,
    loss="binary_crossentropy",
    metrics=[
        self._captcha_accuracy(captcha_length, char_classes)
        if self.save_path is None
        else "accuracy"  # if model needs to be saved, do not use custom metric for portability
    ],
)

그래서 모델을 저장하는 경우에는 일반 accuracy metric을 사용하게끔 바꾸어서 변환이 가능하도록 바꾸었습니다.

👩‍💻 JS 코드 작성

이제 변환한 모델을 자바스크립트 환경에서 사용할 수 있도록 코드를 작성합니다.

전체 코드는 여기서 볼 수 있습니다. Vue.js를 이용해서 작성되었습니다.

1
npm install @tensorflow/tfjs

npm 또는 yarn을 이용하여 @tensorflow/tfjs를 설치합니다.

1
2
3
4
5
import * as tf from "@tensorflow/tfjs";

this.model = await tf.loadGraphModel(
  location.href + "/model_tfjs/model.json"
);

tf.loadGraphModel() 함수를 이용해서 모델을 읽어옵니다. 앞서 변환 결과 생성된 model.json 파일의 URL을 인자로 넣어주면 됩니다.

1
2
3
4
5
6
tfGetImage: function (imageId) {
  // Get HTMLImageElement from the document
  const imgElem = document.getElementById(imageId);
  const img = tf.browser.fromPixels(imgElem);
  return this.tfPreprocessImage(img);
},

tf.browser.fromPixels() 함수는 이미지를 모델이 입력으로 받을 수 있는 텐서로 변환합니다.

1
2
3
4
5
6
tfPreprocessImage: function (img) {
  const mean = tf.tensor1d([0.485, 0.456, 0.406]);
  const std = tf.tensor1d([0.229, 0.224, 0.225]);
  const size = [60, 160, 3]; // [height, width, channel]
  return img.reshape(size).toFloat().div(tf.scalar(255)).sub(mean).div(std);
},

놓치기 쉬운 부분으로, 데이터 전처리 과정은 (당연하게도) 변환된 모델에 포함되어 있지 않으므로 별도로 자바스크립트 코드를 작성해주어야 합니다.

위의 코드는 ImageNet의 평균/표준편차를 이용해서 데이터를 표준화해주는 작업입니다. 기존 파이썬 코드와 똑같은 동작을 하는 전처리 코드를 작성해주어야 합니다.

1
2
3
4
5
6
tfPredictCaptcha: function () {
  const img = this.tfGetImage("captcha");
  const imgBatch = img.expandDims(0);
  const result = this.model.predict(imgBatch);
  this.captchaVal = this.tfDecodePrediction(result, 10, 2);
},

전처리까지 마친 데이터를 batch 단위로 변환해준 뒤 모델의 predict() 메소드에 입력으로 넣어주면, 모델의 예측 결과를 얻을 수 있습니다.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
/*
  [
    0, 0, 1, 0, 0, 0, 0, 0, 0, 0,
    1, 0, 0, 0, 0, 0, 0, 0, 0, 0,
  ] ==> "20"
*/
tfDecodePrediction: function (tensor, numCharSet) {
  var sliced = tensor.dataSync().reduce((resultArray, item, index) => {
    const chunkIndex = Math.floor(index / numCharSet);
    if (!resultArray[chunkIndex]) {
      resultArray[chunkIndex] = [];
    }
    resultArray[chunkIndex].push(item);
    return resultArray;
  }, []);
  const argMax = (array) =>
    array.map((x, i) => [x, i]).reduce((r, a) => (a[0] > r[0] ? a : r))[1];
  const predicted = sliced.map(argMax).join("");
  return predicted;
},

모델의 출력을 원하는 포맷으로 변환하는 코드도 자바스크립트로 따로 작성해주면 됩니다. 위의 코드는 인코딩된 모델 출력 결과를 숫자로 변환하는 함수입니다.

🚢 배포

Tensorflow.js 추론에 필요한 코드는 이것으로 끝입니다. 이 외에 모델 학습 등 Tensorflow.js의 다양한 기능을 활용해보고 싶으시다면 공식 API 문서를 참고해주세요.

이제 나머지 살을 붙여서 웹 사이트로 빌드하여 배포하면 됩니다.

https://ryanking13.github.io/kcaptcha 에서 배포된 웹 사이트를 볼 수 있습니다

초기에 모델을 읽어오는 시간이 오래 걸리는 편이지만, 실시간으로 추론 되는 모습을 확인할 수 있습니다.

그누보드 캡차 인식 프로젝트 - Part 2

Contents

🌐 Tensorflow.js란?

🔛 모델 변환

👩‍💻 JS 코드 작성

🚢 배포

{title}