Обнаружение стегосистем, основанных на погружении скрытых

Download Report

Transcript Обнаружение стегосистем, основанных на погружении скрытых

ФЕДЕРАЛЬНОЕ АГЕНТСТВО СВЯЗИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ
БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ
УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ
им. проф. М. А. БОНЧ-БРУЕВИЧА»
« Обнаружение стегосистем,
основанных на погружении скрытых сообщений
в шумы сканера »
Докладчик: ст. гр. МИ – 76 П. С. Догиль
Руководитель: д. т. н., проф. В. И. Коржик
Санкт – Петербург, 2012 г.
Виды сканеров
• Ручные сканеры
• Листопротяжные сканеры
• Планшетные сканеры
• Барабанные сканеры
Планшетные сканеры
Принцип работы:
• Вдоль сканируемого изображения, расположенного на прозрачном
неподвижном стекле, движется сканирующая каретка с источником света.
• Отраженный свет через оптическую систему сканера (состоящую из
объектива и зеркал или призмы) попадает на три расположенных параллельно
друг другу фоточувствительных полупроводниковых элемента на основе ПЗС,
каждый из которых принимает информацию о компонентах изображения.
Виды шумов
• Фотонный шум
• Темновой шум (темновой ток)
• Шум считывания
• Неоднородность чувствительности ячеек ПЗС
Стегосистема, основанная на имитации
шумов сканера
Основная идея: Отсканировать напечатанный документ и внести в него
секретную информацию, имитируя шумы сканера.
Введем обозначения:
A – область размером n x n ;
m – количество черных пикселей в А ;
m+ – количество черных пикселей в А, если оно четное ;
m- – если нечетное ;
0 < k < ½ - выбранный порог ;
b = {0,1} - значение бита скрытой информации, вкладываемой в А ;
А = А0, если kn2 < m < (1-k)n2 ;
А = А1, если m = (1-k)n2 ;
А = А2, если m = kn2 .
Метод вложения скрытой информации:
1. Отсканированный черно-белый документ последовательно делится на
области А.
2.
3.
Если А = А0, то вложение производится в соответствии с таблицей:
m = m+
m = m-
b=0
Ничего не изменять
Изменить цвет одного
пикселя на
противоположный
b=1
Изменить цвет одного
пикселя на
противоположный
Ничего не изменять
Если А = А1, то вложение производится в соответствии с таблицей:
m = m+
m = m-
b=0
Ничего не изменять
Изменить один черный
пиксель на белый
b=1
Изменить один черный
пиксель на белый
Ничего не изменять
4.
5.
Если А = А2, то вложение производится в соответствии с таблицей:
m = m+
m = m-
b=0
Ничего не изменять
Изменить один белый
пиксель на черный
b=1
Изменить один белый
пиксель на черный
Ничего не изменять
Если А ≠ А0, А ≠ А1, А ≠ А2 то в эту область вложение не производится.
Метод извлечения скрытой информации:
1.
Изображение последовательно делится на А-области размером n x n.
2.
Если А=А0, А=А1, или А=А2, то извлечение производится в соответствии
с таблицей:
3.
Количество чёрных пикселей
Извлекаемая информация
m = m+
Извлекается «0»
m = m-
Извлекается «1»
Если А≠А0, А≠А1, А≠А2, то из этой области не извлекается ни какая
информация.
Основные свойства данного
метода
1. Извлечение информации производится без ошибок.
2. Чем больше n и чем больше k, тем секретнее вложение,
но тем меньше скорость вложения, и наоборот.
3. Вложение устойчиво к визуальной атаке и к простейшим
статистическим атакам.
4. Вложение легко удаляется при помощи рандомизации А+,
А- без ухудшения качества документа.
5. Скорость вложения невелика.
Пример вложения
Покрывающее сообщение с «шумовыми компонентами»
Стегоизображение (скорость вложения 8000 – 12000 бит/ на страницу текста А4)
Расположение изменённых пикселей
Постановка задачи
• Стегосистема известна;
• для стегоанализа предоставлено одно или
несколько изображений;
• обнаружение производиться путём сравнения
характеристик тестируемых изображений с
заранее выбранными порогами;
• если есть доступ к сканеру, то это позволяет более
точно выбрирать пороги.
Атаки на СГ
• Вычисление корреляции одинаковых букв текста
• Выполнение двумерного преобразования Фурье
от сканированных изображений
• Анализ количества единичных выбросов
• Анализ количества единичных углублений
Атака вычислением корреляции
одинаковых букв текста
Идея метода: после вложения буквы с вложением
будут сильнее отличаться от таких же букв, но без
вложения
Предполагаемый порог: значение средней
корреляции букв «Т» с первой найденной буквой
«Т».
«Шумовые компоненты»
различных букв
Вычисление корреляции
одинаковых букв текста
ПС 1
Корреляция
«Т» № 1/ «Т» № 2
«Т» № 1/ «Т» № 3
«Т» № 1/ «Т» № 4
«Т» № 1/ «Т» № 5
«Т» № 1/ «Т» № 6
«Т» № 1/ «Т» № 7
«Т» № 1/ «Т» № 8
«Т» № 1/ «Т» № 9
«Т» № 1/ «Т» № 10
«Т» № 1/ «Т» № 11
«Т» № 1/ «Т» № 12
«Т» № 1/ «Т» № 13
«Т» № 1/ «Т» № 14
«Т» № 1/ «Т» № 15
«Т» № 1/ «Т» № 16
«Т» № 1/ «Т» № 17
«Т» № 1/ «Т» № 18
«Т» № 1/ «Т» № 19
«Т» № 1/ «Т» № 20
«Т» № 1/ «Т» № 21
«Т» № 1/ «Т» № 22
«Т» № 1/ «Т» № 23
«Т» № 1/ «Т» № 24
Средн.
до влож.
0,8661
0,9401
0,8793
0,9439
0,9133
0,8362
0,9196
0,8777
0,9428
0,8827
0,9586
0,9415
0,9626
0,9408
0,9159
0,9586
0,9386
0,9196
0,8636
0,9196
0,9493
0,8512
0,9074
0,914304
ПС 2
после
0,8485
0,9751
0,8565
0,8892
0,7301
0,9466
0,7637
0,9015
0,8429
0,8919
0,8853
0,8356
0,8991
0,8784
0,8181
0,873
0,8397
0,8536
0,7432
0,8048
0,8596
0,807
0,8009
0,849752
до влож.
0,7141
0,9558
0,8539
0,927
0,9042
0,8833
0,8361
0,7876
0,7177
0,8996
0,7215
0,9199
0,7429
0,8229
0,8897
0,6854
0,7662
0,9136
0,8341
0,7593
0,7281
0,9105
0,8284
0,826165
ПС 3
после
0,857
0,8469
0,8672
0,7609
0,7633
0,8557
0,8733
0,8404
0,8555
0,8839
0,8689
0,8845
0,7794
0,7889
0,9241
0,9166
0,7748
0,8264
0,9192
0,8912
0,778
0,8755
0,8975
0,849091
до влож.
0,9075
0,9353
0,8276
0,9206
0,9483
0,9588
0,8751
0,813
0,9148
0,8911
0,8474
0,897
0,9135
0,8672
0,8166
0,8633
0,853
0,8772
0,9523
0,8413
0,8672
0,8882
0,9319
0,887313
после
0,9075
0,9353
0,8732
0,9162
0,9425
0,9474
0,8552
0,8166
0,9148
0,8871
0,814
0,8474
0,9093
0,8672
0,8202
0,853
0,8469
0,8772
0,9523
0,8911
0,8352
0,8839
0,9272
0,883509
Атака выполнением двумерного
преобразования Фурье
Идея метода: вложение секретной информации
вызовет появление в спектре Фурье изображений
характерных частотных всплесков в области
высоких частот
Предполагаемый порог: среднее значение
корреляции спектров Фурье изображений букв «Т»
со спектром Фурье изображения первой найденной
буквы «Т»
Спектры Фурье изображений
букв «Т»
Спектры Фурье изображений для букв «T» до и после вложения секретной информации:
до
после
до
после
до
после
до
после
до
после
до
после
Выполнение преобразования Фурье от
сканированных изображений букв «Т»
ПС 1
Корреляция
«Т» № 1/ «Т» № 2
«Т» № 1/ «Т» № 3
«Т» № 1/ «Т» № 4
«Т» № 1/ «Т» № 5
«Т» № 1/ «Т» № 6
«Т» № 1/ «Т» № 7
«Т» № 1/ «Т» № 8
«Т» № 1/ «Т» № 9
«Т» № 1/ «Т» № 10
«Т» № 1/ «Т» № 11
«Т» № 1/ «Т» № 12
«Т» № 1/ «Т» № 13
«Т» № 1/ «Т» № 14
«Т» № 1/ «Т» № 15
«Т» № 1/ «Т» № 16
«Т» № 1/ «Т» № 17
«Т» № 1/ «Т» № 18
«Т» № 1/ «Т» № 19
«Т» № 1/ «Т» № 20
Среднее
до влож.
0,6416
0,7183
0,6753
0,7071
0,7007
0,5997
0,6641
0,6329
0,687
0,6277
0,7857
0,7879
0,7388
0,6747
0,7349
0,7321
0,6575
0,7448
0,6728
0,693873684
ПС 2
ПС 3
после
до влож.
после
до влож.
после
0,6467
0,5925
0,6145
0,6301
0,6301
0,695
0,7569
0,617
0,6885
0,6885
0,6757
0,6421
0,6181
0,628
0,6296
0,6918
0,7087
0,5639
0,6638
0,6664
0,6673
0,6763
0,5926
0,7087
0,7047
0,6057
0,6821
0,6113
0,7194
0,7063
0,6684
0,6685
0,6177
0,6777
0,6777
0,6139
0,6542
0,5894
0,627
0,6446
0,6789
0,7247
0,5948
0,6092
0,6092
0,592
0,6705
0,6112
0,6492
0,6692
0,7484
0,6944
0,5872
0,6234
0,5984
0,7616
0,68
0,5923
0,693
0,6732
0,707
0,6941
0,6108
0,6173
0,6552
0,6674
0,6531
0,5876
0,6641
0,6641
0,6949
0,6813
0,5945
0,5859
0,5748
0,6855
0,6821
0,6221
0,6339
0,6339
0,6606
0,6411
0,5847
0,5989
0,5868
0,7276
0,6992
0,5903
0,6598
0,6598
0,6635
0,6161
0,6359
0,7564
0,7564
0,676415789 0,674626316 0,601889474 0,654436842 0,654152632
Атака по количеству
единичных выбросов
Единичные выбросы
Вверх
Вниз
Вправо
Влево
Атака по количеству
единичных выбросов
Идея метода: число единичных выбросов у
одинакового объёма текста на странице
формата А4 в среднем меньше, чем при
вложении
Предполагаемый порог: по количеству
единичных выбросов для различных объёмов
текста
Анализ количества единичных выбросов
Изобр №
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Вверх
462
545
601
637
617
661
607
594
586
554
612
560
627
616
444
560
603
511
533
537
Вниз
509
609
660
701
717
704
678
791
671
632
772
676
721
721
559
649
595
652
721
661
Влево
495
607
695
694
623
625
725
675
725
616
781
625
672
667
512
607
644
531
587
565
Вправо Всего до Вверх
492
1958
602
672
2433
654
555
2511
743
712
2744
788
673
2630
799
587
2577
818
651
2661
750
660
2720
743
663
2645
728
592
2394
691
680
2845
782
608
2469
696
670
2690
746
666
2670
780
465
1980
565
539
2355
693
601
2443
734
531
2225
591
564
2405
665
540
2303
679
Вниз
542
654
713
773
791
770
735
866
728
708
830
726
776
767
622
695
655
705
782
716
Влево Вправо Вс. после
649
720
2513
757
936
3001
866
787
3109
851
951
3363
806
887
3283
787
825
3200
862
903
3250
819
897
3325
897
881
3234
761
815
2975
937
915
3464
788
823
3033
782
885
3189
845
872
3264
621
666
2474
778
764
2930
788
808
2985
682
742
2720
748
790
2985
702
792
2889
Атака по количеству
единичных выбросов
Ограничения
• Все текстовые документы распечатаны на одном и том же принтере;
• Используется один и тот же сканер;
• Необходима база тестовых изображений для сбора статистики;
Алгоритм обнаружения
• На основе собранной статистики выбираются пороги в зависимости от
плотности текста на странице ;
В качестве критерия, определяющего плотность текста на странице
используется количество чёрных пикселей на странице.
•
•
•
•
По сканированному документу производится поиск и подсчёт единичных
выбросов;
Подсчитывается количество чёрных пикселей на сканированном документе;
Производится сравнение посчитанных единичных выбросов с выбранными
порогами;
Принимается решение о наличии вложения скрытой информации или о её
отсутствии.
Проверка эффективности анализа по
количеству единичных выбросов
1.
На основе анализа 20 тестовый изображений выбраны следующие пороги:
Количество чёрных пикселей
Выбранный порог
600000 – 650000
1950
650000 – 700000
2150
700000 – 750000
2350
750000 – 800000
2550
800000 – 850000
2750
850000 – 900000
2950
900000 – 950000
3150
2. В 15 из 60 изображений, предназначенных для анализа вкладывается
информация с различными скоростями вложения:
Проверка эффективности анализа
по количеству единичных выбросов
№ изображения
Количество вложенной информации
Вложение 8000 – 12000 бит (n = 20 , k = 0,01)
Im45
11220 бит
Im51
9400 бит
Im57
9644 бит
Im73
9978 бит
Im79
10275 бит
Вложение 600 – 700 бит (n = 100 , k = 0,01)
Im23
608 бит
Im27
581 бит
Im42
621 бит
Im48
640 бит
Im50
618 бит
Вложение 400 – 500 бит (n = 100 , k = 0,1)
Im41
519 бит
Im56
453 бит
Im62
391 бит
Im67
497 бит
im80
519 бит
Проверка эффективности анализа по
количеству единичных выбросов
Изобр. №
23
27
41
42
45
48
50
51
56
57
62
67
73
75
76
79
80
Вверх
466
439
501
508
795
508
507
601
505
672
467
499
740
531
485
718
591
Вниз
653
563
669
659
775
684
644
719
660
708
560
666
748
655
564
748
754
Влево
632
653
753
733
998
813
759
850
713
890
676
825
992
800
758
1007
895
Вправо
712
631
718
698
1091
710
747
937
709
940
661
791
1079
795
707
1128
823
Всего
2463
2286
2641
2598
3659
2715
2657
3107
2587
3210
2364
2781
3559
2781
2514
3601
3063
Кол. чёрн.
пикс.
798781
804339
877083
851749
946030
885834
850749
810658
813280
829337
754718
874827
859889
837569
742726
895940
907919
Результат
Пропуск
Пропуск
Пропуск
Пропуск
СГ
Пропуск
Пропуск
СГ
Пропуск
СГ
Пропуск
Пропуск
СГ
Ложн. Тр.
Ложн. Тр.
СГ
Пропуск
Проверка эффективности анализа по
количеству единичных выбросов
Скорость вложения
Обнаружено
8000 – 12000 бит
5 из 5
500– 600 бит
0 из 5
400 – 500 бит
0 из 5
Ложные тревоги
2 из 60
Оценка эффективности атаки по
количеству единичных выбросов
Не известны принтер и сканер:
Сканер № 1
Изображение Принтер № 1 Принтер № 2 Принтер № 3 Принтер № 4
№1
1958
1945
2867
2743
№2
2433
2034
2996
2004
№3
2511
2393
3366
2086
№4
2744
2433
3431
2217
№5
2630
2313
3259
2084
Сканер № 2
Изображение Принтер № 1 Принтер № 2 Принтер № 3 Принтер № 4
№1
2440
2589
3415
2161
№2
2815
2593
3573
2353
№3
3069
2919
3664
2580
№4
3444
2809
3965
2709
№5
3214
2691
3913
2633
Не известны принтер и сканер:
Разброс количества единичных выбросов внутри шага
определяющего плотность текста на странице составляет
400 выбросов.
Разброс количества единичных выбросов для одинаковых
текстовых документов, распечатанных на разных
принтерах доходит до 1300.
Разброс количества единичных выбросов для одинаковых
текстовых документов, сканированных на разных сканерах
доходит до 700.
Необходимый прирост для точного обнаружения должен
быть не менее 2500, что будет соответствовать скорости
вложения более 45000 бит/ на страницу текста формата
А4.
Атака по количеству
единичных углублений
Единичные углубления
Сверху
Снизу
Слева
Справа
Атака по количеству
единичных углублений
Идея метода: число единичных углублений у
одинакового объёма текста на странице
формата А4 в среднем меньше, чем при
вложении
Предполагаемый порог: по количеству
единичных углублений для различных
объёмов текста
Анализ количества единичных углублений
Изобр № Сверху
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
483
599
631
628
667
666
640
679
630
578
686
622
654
670
526
605
588
551
597
591
Снизу
582
611
697
777
758
767
753
782
719
710
804
743
781
758
579
685
685
693
751
674
Слева
630
747
875
899
780
807
889
853
896
797
965
781
869
827
612
715
750
662
753
730
Справа Всего до Сверху
672
2367
1021
864
2821
1093
841
3044
1157
953
3257
1176
895
3100
1205
873
3113
1247
969
3251
1162
886
3200
1220
885
3130
1140
770
2855
1149
926
3381
1197
856
3002
1115
879
3183
1148
920
3175
1155
612
2329
991
751
2756
1078
808
2831
1111
745
2651
969
737
2838
1116
810
2805
1092
Снизу
609
648
732
842
815
816
791
825
755
760
828
777
824
788
629
723
711
753
805
715
Слева Справа Вс. после
1205
757
3592
1365
970
4076
1625
945
4459
1605
1066
4689
1487
1002
4509
1524
975
4562
1549
1086
4588
1543
999
4587
1580
973
4448
1481
891
4281
1657
1061
4743
1411
945
4248
1505
980
4457
1549
1022
4514
1110
689
3419
1399
856
4056
1408
913
4143
1266
829
3817
1438
821
4180
1400
932
4139
Атака по количеству
единичных углублений
Ограничения
• Все текстовые документы распечатаны на одном и том же принтере;
• Используется один и тот же сканер;
• Необходима база тестовых изображений для сбора статистики;
Алгоритм обнаружения
• На основе собранной статистики выбираются пороги в зависимости от
плотности текста на странице;
В качестве критерия, определяющего плотность текста на странице
используется количество чёрных пикселей на странице.
•
•
•
•
По сканированному документу производится поиск и подсчёт единичных
углублений;
Подсчитывается количество чёрных пикселей на сканированном документе;
Производится сравнение посчитанных единичных углублений с выбранными
порогами;
Принимается решение о наличии вложения скрытой информации или о её
отсутствии.
Проверка эффективности атаки по
количеству единичных углублений
1. На основе анализа 20 тестовый изображений выбраны
следующие пороги:
Количество чёрных пикселей
Выбранный порог
600000 – 650000
2200
650000 – 700000
2300
700000 – 750000
2400
750000 – 800000
2600
800000 – 850000
3000
850000 – 900000
3100
900000 – 950000
3200
2. В 15 из 60 изображений, предназначенных для анализа
вкладывается информация с различными скоростями вложения:
Проверка эффективности атаки по количеству
единичных углублений
№ изображения
Количество вложенной информации
Вложение 4500 – 6000 бит (n = 25 , k = 0,1)
Im45
5944 бит
Im51
5022 бит
Im57
5203 бит
Im73
5370 бит
Im79
5542 бит
Вложение 4000 – 4500 бит (n = 27 , k = 0,1)
Im23
4310 бит
Im27
4381 бит
Im42
4730 бит
Im48
4932 бит
Im50
4660 бит
Вложение 3500 – 4000 бит (n = 30 , k = 0,1)
Im41
4039 бит
Im56
3655 бит
Im62
3417 бит
Im67
4035 бит
im80
4055 бит
Проверка эффективности атаки
по количеству единичных углублений
Изобр. №
23
27
41
42
45
48
50
51
56
57
59
62
67
72
73
76
78
79
80
Сверху
816
820
872
958
1090
921
954
902
897
970
503
758
917
554
1014
505
626
988
991
Снизу
524
555
612
597
628
636
593
611
585
589
502
542
597
579
569
464
636
631
636
Слева
972
935
1027
1178
1320
1139
1194
1198
951
1127
716
909
1108
751
1217
748
851
1313
1093
Справа
870
736
815
885
978
894
907
821
823
906
729
831
920
788
974
809
999
987
940
Всего
3182
3046
3326
3618
4016
3590
3648
3532
3256
3592
2450
3040
3542
2672
3774
2526
3112
3919
3660
Кол. чёрн. пикс.
797697
803207
875871
850369
947416
884670
849600
811790
812272
830607
728304
753756
873734
789339
861138
742726
897774
897435
906858
Результат
СГ
СГ
СГ
СГ
СГ
СГ
СГ
СГ
СГ
СГ
Ложн. Тр.
СГ
СГ
Ложн. Тр.
СГ
Ложн. Тр.
Ложн. Тр.
СГ
СГ
Проверка эффективности атаки
по количеству единичных углублений
Скорость вложения
Обнаружено
4500 – 6000 бит
5 из 5
4000 – 4500 бит
5 из 5
3500 – 4000 бит
5 из 5
Ложные тревоги
4 из 60
Оценка эффективности атаки
по количеству единичных углублений
Не известны принтер и сканер:
Сканер № 1
Изображение Принтер № 1 Принтер № 2 Принтер № 3 Принтер № 4
№1
2367
1992
2578
2171
№2
2821
2070
2794
2239
№3
3044
2557
3151
2671
№4
3257
2608
3226
2788
№5
3100
2486
3198
2559
Сканер № 2
Изображение Принтер № 1 Принтер № 2 Принтер № 3 Принтер № 4
№1
2593
2726
3101
2534
№2
3252
2680
3205
2621
№3
3578
3076
3561
3061
№4
3769
3132
3686
3041
№5
3475
3016
3610
2996
Не известны принтер и сканер:
Разброс количества единичных углублений внутри шага
определяющего плотность текста на странице составляет
400 углублений.
Разброс количества единичных углублений для одинаковых
текстовых документов, распечатанных на разных
принтерах доходит до 800.
Разброс количества единичных углублений для одинаковых
текстовых документов, сканированных на разных сканерах
доходит до 700.
Необходимый прирост для точного обнаружения должен
быть не менее 1900, что будет соответствовать скорости
вложения более 16000 бит/ на страницу текста формата
А4.
Возможные улучшения методов
вложения и обнаружения
Улучшение метода вложения:
1. ПС разбивается на области А;
2. Производится анализ областей, пригодных для вложения;
3. Производится поиск единичных выбросов и единичных
углублений в областях, пригодных для вложения;
4. В случае обнаружения, производится добавление рядом
или удаление единичного выброса или углубления.
Возможные улучшения методов
вложения и обнаружения
Улучшение метода обнаружения:
В качестве критерия, определяющего плотность текста на
странице вместо общего количества чёрных пикселей на
странице целесообразно использовать количество
граничных чёрных пикселей, так как только они могут
быть изменены.
Выводы
1. Предложен метод на основе подсчета количества
единичных углублений, который при выборе
оптимального порога позволяет производить надёжное
обнаружение СГ со скоростью вложения от 3500 бит/ на
страницу текста формата А4;
2. Установлено, что для надёжного обнаружения СГ,
целесообразно проводить тестирование сканера на
котором проводилось сканирование;
3. Сделаны предложения для повышения секретности СГ и
улучшения метода обнаружения.
Список литературы
1. Коржик, В.И. «Основы стеганографии», Курс лекций,
www.ibts-sut.ru;
2. Solomon Chris, Toby Breckon. «Fundamentals of Digital Image
Processing. A Practical Approach with Examples in Matlab», A
John Wiley & Sons, Ltd., Publication, 2011;
3. Gonzales R.C., Woods R.E. «Digital Image Processing»,
Prentice – Hall, Inv., 2002;
4. Коржик, В. И., Лабораторные работы по курсу «Основы
стеганографии», СПбГУТ.
Спасибо за внимание