From 57977f3ac135d9e349ce283e26c6f6304c089d34 Mon Sep 17 00:00:00 2001
From: guoyi1 <guoyiybb@hotmail.com>
Date: Tue, 19 Sep 2017 21:02:40 -0400
Subject: [PATCH 1/8] Main algorithm finished

---
 README.md                      |  14 ++-
 img/result1.png                | Bin 0 -> 16875 bytes
 img/result2.png                | Bin 0 -> 16588 bytes
 stream_compaction/common.cu    |  61 ++++++------
 stream_compaction/cpu.cu       | 129 ++++++++++++++++---------
 stream_compaction/efficient.cu | 168 ++++++++++++++++++++++++++-------
 stream_compaction/naive.cu     | 109 +++++++++++++++++----
 stream_compaction/thrust.cu    |  40 ++++----
 8 files changed, 375 insertions(+), 146 deletions(-)
 create mode 100644 img/result1.png
 create mode 100644 img/result2.png
diff --git a/README.md b/README.md
index b71c458..1d179f6 100644
--- a/README.md
+++ b/README.md
@@ -3,11 +3,15 @@ CUDA Stream Compaction
 
 **University of Pennsylvania, CIS 565: GPU Programming and Architecture, Project 2**
 
-* (TODO) YOUR NAME HERE
-* Tested on: (TODO) Windows 22, i7-2222 @ 2.22GHz 22GB, GTX 222 222MB (Moore 2222 Lab)
+* (TODO) Yi Guo
+* Tested on:  Windows 8.1, Intel(R) Core(TM)i5-4200M CPU @ 2.50GHz 8GB, NVIDIA GeForce 840M (Personal Notebook)
+
+## ScreenShot
+These are the test results of all the method I implemented.
+![](./img/result1.jpg);
+
+![](./img/result2.jpg);
+
 
-### (TODO: Your README)
 
-Include analysis, etc. (Remember, this is public, so don't put
-anything here that you don't want to share with the world.)
 
diff --git a/img/result1.png b/img/result1.png
new file mode 100644
index 0000000000000000000000000000000000000000..8b034f5b748b854d3121f113b9492dc9076bfce5
GIT binary patch
literal 16875
zcmdsfcUaTs-Zuz}l;x-*yVNQ;5FsE&MntT%P=;EW$`A<xLJ$-L5(0{(Rt1l;K}IPq
zkf7`t6cvGlFoduJ0tvDq5XgS-U%<BKxlT`ep67k8>%HDTWc>K;`@X;5&x*Hft<7b=
zQ2atfL`3HM?~b1m5n1<(h=^#`#&uu|-|W6F_$C^3%KVr}L5uPy@Qb*Ysg<dS$cs2B
zuKRlMyJWz3jzJ<Kvh~nE(FW9$3nC(>k>4LT{qdU1bUz_>-??Cw0OJ;;>tE;Q*uMJV
zz{VYShQE8dUeosDCAaQdTTSsp-&MfGVshX71BSRxJvxZ#`dFLCWYzDzPuhKZ5_imF
z`b^rlgW*d{tT0+Ef67(xX%@p;7;8?_b~SJnjNthb+X@z*2C$Nsh1+UpDw{5IPTRA7
zEJqVLtNVqV8!P8M%|q`!YeHK+7GG5m*w6oP#$?+8HAXEOIv?enJ=`BVu{ZOJq_|L5
z;kMfpRAN)0%YQvs+r@~iA>2NI<vADmGhN3{4=?D<Lbp_lo_9(gqh2O9<kBl?O3<C1
zL(l{rSQZ{vun-8HH>_q7B^cI@V5CubRum3<agx=5K6`i|yZ^|Q1e=?_6deIUKo&ea
zCzwHSy?7HIgOr^G1eO_>ab+GyQ0mtjL+}r5$8zG@xs#a@f+PZq<jS8%VfB+{r~E2d
zx2XaKg2zJ$=E;OWUMvB=p`6j2DX7o9!V2UKph5|4A&5mu_(VsqxeCA6mCIhLI*0A(
z)n<NN;LH`fW`Tzv*~iDf&<oY_PZ(jwO!8qS&|^#=p$X^$cG5%W^@O+_wp~)<A@~Iu
zPhB-6;%b_gu72&`b?xA!lcC-G1<Wzk;l7SsLt2%&pPZz!6I-E|kUyFy8}T~Wo?kLF
z8*%$az??6ZxTHn*<?dZbnYLe?4EZWToxtB_&c93Vi-;Nn@6#9k77?G@=zBR&xy)QU
zecskzrLyVq>ypW2LD2vh+{(#`me=!3SNF!3;7?mb=<?aS`8dS8UfQoj9L0mL9l^oj
z&782kE~*Sy3QcA5DKYQiBKm!{jYHy?BDYs95K}W!AIBo?5^U*kCGd~ePRcug=|Hde
zsP;1ZWhuj{Ism#f?tt-tJ~aRgO>;vvo>Ea;%ZMeH;`1=BG{-*F#6bDS)}M3E2VMEp
zHmJfN2<X8Z8<%+`or6bcOBXXUnqCHtZ;e=bVD>~%($L9NGP1%(l~2?w?JtvKHREw3
z%i^Qnu5s)EDmUy*)h@YDf~$|u8OE{ZwGS4!su?1PFKiZ;P$%UHoEko>%Xd+#!DEbp
z65QEMu&>Psm@lh2-4*PDo<Hu`0`8Q9=bxQT<3V#@R+(`PbwSf(PG@$K=^HBj!DC_4
znMq5##yNoY{^;L#$73ka4UIY7Qg0@kz<ixpMs2{WF{Z`JG7VwzH_J!6hHZAl&~14o
zDA$z+CY%twxDzv7?Am)Vv?!qBkWDw2Hc~XN9$G!06JhMN_`-mYx#T0)Xw%7C*Y^H3
zn3ZzVIjSq)OiQw)s+oO;f}1cD7S2doVc!F{iMR?)^I4rtjU(41&VVI35TPa8{HjyM
za=OYW6_09|cAmqJgmMB{5zo!9aW;^|kPHkuf>;*Pk4~bxEIgIP92>kIrs#*AW^X4H
z;K_)?hZ~wNCs4`wBvjYv$fsFVb9h2o$h<RqjDp)^&-t#8I`|6rDPn7F!9eEdWK^Hr
z!EoAyd<NMYtH(Mq32y7B&$l%>r-T1xe+`)8Wv&tgcm!rE6`jUs`}fr*G^<|@r7<}R
zv}@hU!-oTFRjc3|4jG1yNw}aFNYBMG58{Kb+$1r|2u$Y5dgj(9ua@P92PhA=5#&_%
z$5TUjq&vRc@T;t{MAGGJdpJCjbFtiMm!EuRH58288FbF16aTfRDgSUm?Hh{3+0Qj6
zgr|oWh35Lm1a{QP#g*z(Rj*z99J>_ivaslsE-~g%nSLV8BWsGgmvy4U=76Cqg>O?{
z6L6@RAby3wbj4XkwDk8B86BZ{NpyZRfE5hSZY!9UVreUngtU>31P8+rjYE=o9uZ6_
zL1phTED`VWaZ>DaaV)6fSFs{@qd;-JN?uy>bCN6CN1=pFkcNBt^$Y~pKZscTV5lq&
zb}3x-O2d}eOoX6$UjvtRF%!KovqI%bP9_MR8scXtv6H@9ne`7pRa7|+sxo*QNqLx|
z@HiIJu#}e+N6IDCeZuwdzGrKo^>27Yu%t4%i3P47CwKmKA7Tw$RcNAw%>R@y%WreL
zR8~qi5Ba5dc3>>r-;mgJ>lgZ~A%~APmk6;@l{dWnWhK#p#<%)#du#?dk{-{wyFb7_
zQOwyLvx0jzoUr)ngYTGxZQQF7Hc69?OG{|um67Gq1<_dL0z!mYsa!sa;>r$pK@h3D
z?V-yW-esd9kM6R1nYh4EYYcutiY{h={rdJFXERh8lB(vc7+(|g<zhq8H~34_OAFJ^
zY53WSlZ{d=EtBF?ayP116iTTLZ&wh3n!agqmn)d)*TE%4^z&D~=Cex#>}`Jhu}H(Q
z4(lWqN{KM&%V^$1hzh)exf>Y5;M{UmY;5RW^qw2W@=lyH8I(5;35mE*(l%1fqhH~b
zJsH-nt~qO>9wC`zPl~{!S?qbxNU-C3wU@^xo$(8I`8fqD1m-KO^xO%GhG3Yzu=He-
z4SE*E($y95V?yRS1g(<oi(RIs+wkj`#wJaLUC=t5_1GP1TA;g5M#~HG&I^*>)S@xm
zF^@rEw__cd{%`)MZ%h;PVY$nz-8TszQqcsD^}R}D2yALnQc{fD2)sT5k8lG`OiM|r
zkx*kGk;up3T14Vh@!)K-VD@_F`o5SmK_z=U<fMGMaQyA5b&hlIE>OV^s;FS%<en$+
z@oul9Tf02uLV{#m)h&;9y}aNzcP8yViAbE8ul8`U!5fEuCy#`WCc7u!h<z_rUy_%L
zbTCMjzv5?e2v#JgXGjyU@q*N+K^z;#;j1Dtg+2~e#9-zkCMM9=z5G#b46%mqPo0Xg
z7tM<~Q{O}+nzYX)$H7z&qXq(r3}VmSO#f&lPVD#7oU=n+uLEQ}&+jw#(wREBp~dp-
zz+G(^xJHK>!)RE$`{zuqw@Jd7?(Rhk&dW$=sd{}aN=Qdx^xNmEiBV_jpSgP?k!nws
z8Ag45pISaVTr^N+giTB}npGZbR&S8D52`Cac(%&PC+2ESs40bc0S4n7t@p?<Gk86X
zAW?0|S|rm3qQZ7~{AFahoy7$${rbwbOGspJ96#Bs^4fC`lc6ug?c^^h`E`L^HX7FX
zI6vZVS9I$H53HY01g{Im-FM9wAsmYyYZDrHgVtcqr=;|Fvyu&9Fhi|>8Xw_)5ABp0
zg23pwQ1F;#!>a?A5kj04U=8SWFX#?!c;2dyWwS)>WT4mg%zgE8ihuW4U06}v;;$YV
zUa`DQeDAcB9^AYQ<IP{620Ct3;Lkt(G9?9*^_Z`R0#l1Tx_XDJx1K1x>y8B-@TXv>
zKY!k<&pcEGHq^*Ym8PJB>+(3`IrpUckNm9d@8GB9KOL1MmM2vjVq`S8StjrK+vnj!
zFX|?;SH@#HtyX>#KJir?U;UbHVP*ZC`n79A=&dHdxR;caU)3;z2h>WcwFzIpiv#Q4
zO83tOsyK3uTh*J+n9lDX&Lz_W)Qt9ychl2`)lJPuZQt=0Z>DZ-s$+eHc}}x^*Eepa
zrx72;xG@gXNBnGZnsJidYs@;t+gjX)P8;4DGj@`_i6rSc#62t*ns0K!Cc=uRF_qS^
zm#jU~n>}VQ<`E%67WHGJm5fA-O=Uf+tpuC&>L$LzOz)?fW#%ZfisVVOdHL{V<HBl9
zyb|MH`$nC~xl7BLb8_okB>64EQ$=M8!|s_IpUy1OASj{_L7P23G5#U;E>BjAut$w?
z#^f6_oym}<B(HJsqU=@gd&C%i3erPZgd$@VRKLr7$}%*XV6l})ZP|VKnT54g=7Q+j
z3RmG@$5Y7ZOZXf?G=|~8LW|cuUpuD~Tb$(WF!NZOl8@v?Tst;YJ&TdsBljw~dobI`
z+?*sA-LSh<?yWhM7hvMaQ3lh@Sxfb0d5J4{xLea;1h0JHYF<O056ATcA$gXc5Z|P}
zVP0N%!P@2?XV#2rYT$0ju$>!RMj#eRq{Wl(*ZU7-VJi-$qB;<wR<FY4mM}KfabZ#z
zYh-jJ|4@+zk)6Y)U(A7Cd+V3g%NyB8No6U<?p=h`CHh%vjZB6l{A1S{Tp~3-j`eh*
zSa%SQb))usFpC`t9dlz&KDDnplU&c0H<Xzut1fM4r#se?<|OME4)JopDBj4^CR7H9
zVII+xh%P3RuC45xg4w|hWa%ScyI#G>vSKA?wm&8<7_;e%q?6#q_;k%?;|CtZwNrfT
ziue)a(3iBF#ggy^Keoo|ErN5#*V+}OE-klu`IuO^R%zhfVF9&nRaJ;**q;uis^uCL
z-SGu?`#~};)a~j%liWQ!-KLRfi~0#ufdmdGvhS6WOy15Fi&sh^2!)lfS4yCs*vY-d
znXq5nvOzfvM8{nO#YEArVSefSfZAJmslgQ*IkWpvzG}3bpMy#R<@Qy=yG|Br9bKxF
zI>!>D$8?&_x5-~hD(@{k^7OO{)Bqm+<??*1qo%Q}E?lvLH{wD$I^4|s3?8=F2gwAj
zq>ubw%%uK|A%#fX&q^-Kd?C1k%i$oA+d*L(=_`J%G4z%Hq*wWe!peAsW1lQt>J)`b
z5GqN23f-zn+U6U_!Hp$Mfp!tOJHX#6Mn7LP?-6QyVScf>?2)g<QuPadZeSvjh>xQP
z(&VzEu<lx9v^_L-^hPurv?h7A6ut))dlyc5^L1oybA7t)h8E{ADR_b|*qD}rNqr#D
zBRI4=r@#P8IjfWy>HK}O3H7LJ2E2Yh-CkzGw`#b0AhT^fDf^DS%yJPCzbn2vQh%v?
zkT_+IZna_D9BfL@9?feCRCvG)UyxZGOMwvsBeb&1$~!we|8USHB-5L#){6>^x$kv_
zZm63jnVxh778G;eELPYjtdjI`x-JPEg|8Z<Z$mp<M-U~@NfO{qNR_sGoj}}BS!)la
zWU{UB@ba)%!F@$OFB?U6M0Il2rTYCH1{Txn<S)72x7tv*5%dugGAoXi5&{>Ajc9>h
zd+>R+FyhF5al6NLuBU|kvzsm~$H8I$rsigNWMB!^?n}qfBUMzkx*S}5Ho3dD5Qnxl
z`X(S^lgXlIgi<qZ&xq7(4e501Ff6U6yojeKxIz7rNmx4XCoog}rTUzLYiqVm`JmC_
z6JG777iF(-lDh~m`DV<!DbsWhzI$-(QcFqrkk&dn{G6HW4zP1v$khthqgxNV77i?T
zaSSp=)E*7h*z0re)wdIw*9f2w)QRnDTfP{XkgqPj7!|bE&(0M-9J)Vrw~+yt8cfD!
z)G>Q;k`*x`p3$ZJn?dyxdyum~sX9#axlw-g&%)(PAB@#KYus%{vt>tacJOPiD+Nt4
zb!5;ED+PfMX!#@sCYpT`I{{vPrQ1GaP0I6{9v!^kiLZ72mL@F~m{&PWJD<`tpv>@<
z+@+R)C*d(Wn7a_K=BA53C^v0%f|hn3+)X;AguJP^8b%(q29x7LF0V~F@c2fj8KO^D
zT2HUDD&uE^1MDqU=c@+N$D&VpQ|ULCoGQ{hB095bOXEgvrzu;uz8LjNt(nbsu_T#m
zx#X3xm5a#%UKx7~;a_X+7jKcjq=9;zON-RG(4|{4&>7U8Z%|ZX!1s=LvVR-^vnL7`
zr{DcrLt8tomixvKF*<za+##56tIiT>>;A!FLZ^YLB?+vuTDN@|g@nP>v0ulGLmy3z
zCTF+01ntd@O*K<+ci1qk|JdCd8J^BX6jM$Hwdw@L7&49(c-rO?bqI;ViAisAidBrk
zG}@dV{L!2Q7T;~@i%^kip9D8@xcU3$@P!|G8g=Ro#%xct2HM2b>J;%>81{1xx7xi9
z7-vbRE3F}taQ?ckbzt?s-y&sde&J}4lF7$omZMoab+bZWE_8uOzrN3p{47DiKa#R8
zZ$<^SQ^bE)sm#7m_eRm3g{k{|L45$2s!6(6La)xJDo(_2Qoa;GpH3!xS6Yt@0JYdJ
zv7Cdjq7F{0hpLxRp)LSc56L`l2=gxfdF7k@vB5|%fv%spywVTgh9>#d#(e+R=6YbV
z$mFT8J&i<#6UT6WVsj1vDJo66E-s5@ty68<Ba(FxT<XnseYZ8Tvs8RAdBo*69F_>`
zE;Qvzcg?+1URJa-%;+$HU4s`Y8Y85`r?dm`LcDg%oppLnUCgU3saxExPj`M$dAT%A
zcx9<l25-H;LH^(y&@g1>&Sac@r!*vK+F+uV3mOrHZRN)tEqS}!f4vH)x(k)K8`MAi
zQd;j+qc88#p`vQs4D|u1Ocw{umc1&<YV)oHC4$lv+|DyrVACYDOn$&xra8)bDl5)h
zghLp3*X-phf^93w)NeEIC?6b*#G{Ho31Ls@2E)2%Z6`oy`@*o!V(vtaRi;;=Sbl1I
z{N@<XC{V>N7HN>(Bpmd6i3_Tg1dTjL{1x+}b{B?fC8GHY<3gu)lA|mf+5P?Uve!{Y
z5i(QUxX`CKWz6>7;3ZSeRoQyg(6}59zOI3LfOP?&k(`ARg`XV>5-v)*zEpb25^ZWG
ze^$nzh*<dE*WLgpRUi0-dVH&Hj(t%r1@(($N{P9N53@IiN4(@3PBQ=GtH0b8;<X*$
z<gDPIh5uGI7gx*LGilRK{T3Xfy}fK`;#liL;>Jj4Z-)cQ1K9N@w2(#(x_xvG0Dv8Z
zM&dRi!V+zHn>4Hi5THKq<)KuucW;8dYkI&b4!gq6o{-Fcldq<DAO{+-!U6YE1jI-T
zrI*3ic9A}nCX;t>nCBe|v|N5EySKH;n2iD0@4N$lBl<qresUcIWuqUyv5Plp;QoA%
zO?#%~vM_=s&R*9ri!Hyp(ZykIaHk2@L{vS?rall^YBcGNv0qBN_{E?v8|nT6-S_+#
zDsh8)7OvKDa=FNK<9KKOEa{M!asKSH)pzyWfK!DjD(xmr+qI#PH#W7JQMq68zDad&
z`$~M#+ktt-3Px0Xzq#y~LP+KG8ALO9@z(-dH?xpq>YmkiO^ydCCc^5++@BU4_;rak
zH&d9NqD2mKpq>HK3Y3iHao1n&BK0S4_w?r5*vk)1^j>oBlDDU@Z`L|G?AP|cxip}6
zw&N6Rkz~_m^NT{)UF3M0!T?k|HE+aXOh#$){IAp)Rq+~0^M}~?9HDZmz(zi&Qjj(-
z&M0OG2kBQzUGBZ;GHFoKvo_5Y1}Zej<1NOaCqkGPgr}39Ji)j#Gu7B?;M*;iuH8K|
z6JGh~^Tmu(!A!Rp92w{DJ3Oo-moG&A;cJL%0~!OCXvu8j*=>_10sao8%QkcG*7rTq
z+d(PcdoAZvTI811ZKLq?^{5{LzMp%?4SMMVZOiA>Rk-Un7{5|t(81Cc9{Jl|Cprv7
zcY$7$0h(3NVW~lfj}zRSz*@KPx#6hJg`hxxhjY@+3j4+K24<CFJdXmX7Sow_xD#SX
z$fm!dg1_^r$8QC<CaZXHXGuiW_YKt#Ppi%;6!cagk<1eSp24RP1H<FBDLu~D26f_4
zIbUQ(-Y9>bIee;q;uLaYu6C%XudreX>yoEixUwtu71Sb+@M|k#HnmE$$n5KpQ2B?b
z)lh$`w6BAhofUPzo1=G}@|EKo^nA~5i<>49W32fd)e&kRl&=s0Qc@V`d62*?0@#<y
zKRf>XK5T#BdmXbzb@S*f$4?6fArh51c+47f6SGDn5>ErLPJ8>J9Zh<dwlpPX*N|QN
zOEOrrvyD=fiGK;vE{)%aNYxe|?RqA$Ik}h$0rJ5I@>jHiVjNrWyB4>Xg;nOm<L93Z
zM<lXJqJdQ5a#vu+v1+khxHE$`-=G)8NG}*zJ>buvnvW2w$!`$Wfqx0r=vS<Q03b``
zz#J?uX^`c5E{NQz^Woov%C&!(^^jDlcH?d_H*q`g#B^>0mso|q5m7>B`D8W_iQ7#U
zlN%h@=U<ZGCqm-D)J@EcjZmGT|2c)G!)dH#f|8xh8-rTTbG3zgW^=K(rlrE))8Ck_
zqe~2%xzfsBpp$iLze2yRW2u-F_1re>vtb}stlS08+FeY<sCrXh!u)y_cJw64EUtGp
zO*LEzoou_XZxV5Vn%om%LQ_N1ooCNhNeq4+kkO$(8VT)u%|3~<9=x;leHc^?mLWOk
z{>5PUnR+?+e$u75WkcG$oKfKxOxy;CM#W=C)eaj78&?eI<B|s?2a}C5i-zv9=#rQ4
znB;rD8*NWqoOA{IWSnQljz@LQkktTrsSI&9bd=3cy`+0VHdhW{fKq8ddt~z9Gk!~D
zfG4lg{5@XqcoXnGA@F=2LRe`k40c>4O>cj8f4dN}ybgQbPl6E3!bw&yw-@K`y0BH6
zYHbN1dsZ$))j$!y=g5&ZZ8l{5Ff&ToVqw>-MuMj4SWCVT29D|AuZ{eo-S$msAIZ^L
zGl7Y5alj{3!D$d{;2f?kZ+s!HVj1zMhod@C@&WzfV@X&Z*_0z4LQ8r1VCVJM$A-|a
zf)|3Fd}Mc+A+=8Toio-Tg~6P|M>1)+rt7h(H)2z>^*n#*^<6tHWlKzeK|sdHpeL+o
zgUV^D(W{SE9B0hd;ty-^D(U2>=Z@A+gAcr#tYa0v06^{3#1lBwbpd`;OhlG8Gz!eZ
zRrDoRQR}GFhBHk<*eaG<7g~@%_QbtAiK{neb@hXCAZVVeNU#RFk)rhCY7KJyLuDBH
zw5+GN*7AjMC0O6A5q5oCf+mL6F4hDJ-Kv^YN!NDM0%h{n{ui5|B2YHG^FZ-&Ayw1Z
zhq}Aj;auSWGv6s?c*8ZV!ihm0*t#LR^L>T)<r9?wR;qaU2%tMryXV9#%u%uYQqIQK
z(g^oHP(1xIfqXPD#EWH_&zH#opjIPiOuPI}Y#&g&I#~UgLWzw0=XKE<D4qBggSFa@
zTTs4JH?bRiT!_9_@ff6tmDHcFF#2LAKxq3%#=gZ$kyLrQ86tlGc7B#aci}S-FA!>I
zKDY8#zdNr(5ijH2OGe-r*bN{<wK3`o8~E!0j01m9*pY}>ucjNYy?)E$E+AuQ1)v%@
z=dI>XgxsFqVy|R}`WW3{gv0H%IWQtK7oFvi35wK=5SE26^q${Zc0CpYx|`(#kC^*w
zFfQVBnj-*evyHIIAiddaPEo%z^-QG@ml=NIXGmihH@2(MCZ1>Q4AdNHJ^vVBdt0_{
zfr?YaW`JMXG<HhdF&LUu0*X_7ZLm$oD_MZB+Q77aEnB#yy6s{IU13Tj?~$How7a7a
zsZBM)x<&2o3Sr`Gqfghqfwuf&3c!rym&fGt6Mw^sJcU+nevgK!T)sF;ulFmQE)yv=
z9(AU}Aj>$g?pkN|nEbFuL=swe-B1@;cG7S2sbYAUl#*FSZ&*-pNY`>qnj_L-v?MRB
z{-!(p1BBMv@*Js?25r&A-koat;nQsq$WnZbaD9ePR>5xDk3E+*Xr+9OYX_huen~@N
zkfdvdx-8Wt#T%%Nn%XQ<R&b=4`!zsI_ibA68_hpS0s0cUQ8=bR>e!xE@2n|C_hozf
z=}FwVHQgRoM7RwY5VHKv7KdAo2t5eAm3q2W)nCGP=SZiA?3e*xb45!H<1t|Ow}oe&
ztB<49HR8h;ITs^4-xhK=uY7ZB`de3@97j^v&4+K8!UFL!#dS0D@ald1ucNlEFRLkw
zq<aP4F|{Yd<Q1BPa@|G%p@tfPa+#KZiw8hz6HxA2q?2&Dm6i9p((0@J033TS%6j(a
zU~e5t?abFk`WBg-I~SSfTXfUW_3XJxc?eQgmv8F|=?Jj0B()kKzD3+Zjw^Liry<lP
zjmcR&0Aa&tX3g5K0Z<%kgdpODL`VmVfdD9k(Yn&W;5epDFV`GO{e411Xl(|X&^C~K
z12EnR14uSE$}tSrT_h<o#Q=q@;$#S)3ml))W<@IWM*{tPx^?09|0B39mfTqCesvH0
z><v%160~az#5ULW?J76~SlQE9pv=Qg|GChzX107Lo~(u;LF&Q)e>olqH~ygCzJsb;
zjiMSuZUk!lE~M{cSw`nKuVepKeAlYd#P#REDUdo$wqb-d`B*zegdBpw!q?Lgw0~@E
zvVEsFb#m`C2iOtJF934!(uB)2gW|AzS|2igu7k2lFckh&q{6uMd@;pR?Q>i0ES$&y
z@RK>x!s-CGl5+EbGUM<_R06nIgCV#WK&Eype`-%8#<6q+xjgx3M0{NjkytRVgP@I!
zc8+F#7n2uUkdpE+IW9C@j$;#YxDtg7wjcwv;AcO)HDFWOl39Pb8`K1Zddy2QVE0ZR
zeSRa(V10(4tyNafk^{=YOF2jttgFyh=qlWhpIYl!_p)6TKK_&R#jf(bs(ooG#%~(2
zsg&8Y)XqZf+}Lmc^QIatIF7YZwMIcP-vZ*P2_OAwlit2_s<dd`fWda>_fO-&#vbC-
z0OpMi10%a*Yv1it6Wv}nBizdm?H4V(pNLsK7ywGe50v2g&?-cZ6ktAh#Tl;@S4&L*
zq9<O|r1Y4f$88uz=@w5%_N$$8ad`JDF9R)x38hIFrMp@JS$^q?W02;^nR?!SNJ~mf
zsWDVzjG!hlw>CITU$f3Oq(V5m`qwldRSFw)_8s3<?AlKjfg>F*z=}eaD+B{Z@9tGB
zN@6s3W{KNbp7j&HG?_d*X7&Z3rfFYZx;|a%)p_B8C}_7Vv+d;rg_WP+QQF<L-=s+c
z4Gc^H!UHvi+W5HX)hoc;8~iDb6&C|j1%K$d_3s83vYk4Pkafre?ZLvZuWRQAP`rCM
z<?A6oT%wnUys}#~1}GzsaC3LSpi_U?9v=O;ST8Z~SW3*8ZO{I{&<?{rv+sasM^C4e
zD;-v&Vy$?%54%^jQxTx_jAR&T40Sb6{24O6{GI$gv3GS9Z5t|ZRar8Dav@QjmJ<kf
z??9q$Af#a3_bNO+H<+gw@g9=4s;N40*rBL|@o>F5i>^(7SYHRats#Cl$^uM}h_G=B
zpRSKSYbMgK*tA}J$KYO1ZIq{G#d~K3-F=WCIk6{Z_VE52OaP$3kQv>0_zU6YhPC0C
z_8Je;!~jm92yDQ&Laok_wxo6yl;vX;xgIot5<g3I*`q+=0G`Nh`2}A|NWWI$Kwofh
z2)qK!>JMph5T?@%-5mmU*|l#vj&^V7vDQE@yP`p2*Wg03ef8zGq>EenrfK^%;w?BP
zYl>ywhNTjWvTOh7PtIlzk;;~tSKO0t569Aug)})Vz+|W)YiHi6xt|EY-{vp3Lo(h#
z&QVK}sK@(!PoJth`mc^Cq%Vrw!L@a41#;j?Sp1_q--nZ=CQAYh8n{lcH_dEl3F@!9
z<fHofSnFoEH@q1vHoIOg(2Sp=GP1B8?Lc1~%>qxnO9(K(?De(I{cti!bEkB3Rt*5`
zfH*u5;Fw2zWRD<Q0=!(_mq<U0htmKchsfDkN2S;(MhT`hFcGlI{9-a#N}4Qhwn69G
z{Mas3Fo)9uHFsXD&@h9j3!Sy^TK@4*uq0LB1qk6A5ao=qqP}3vEH2!-2?>l9GHRCr
z)79S-HNCzM*`+yn5qbCH-QDK>UqIzWW0I;UQ`mcQLusFv50GI0mxM;3w0O*+ra80I
zz--+&uOm1JHIJ#zm1OJ=$p2;fSO*g6n{Nw=_&-~^@|S>R>{1sRkxDsj7u3E`RRq@W
zzQY2YxOCeX-AC?mKw}1;aFKn$f`^G&qqjp$dy<Yf9@OQjZRl|w!GQ3m^yy@qOS$B;
z?8wjaHs;JS8XTq;(jr9M`_o608x-UKD<zr?f{Ouby6E+vgK#u4j-@?~{fe6{(Sk(I
zk{h_mgaK?ScPlxdvqc}A7MQ|Q&HN6P*qO8x-cNKD#!BgvImyF6^|96c&lY~JWtKg3
zP^q*om#lFPMMzgOj>Qv%O+p1rJ!|&&Y$K++P@8b=$dAG7x!Mo(PcIw0Uh)EPZ#hBP
zWfp(o9hJqcc-N9eJ<f-pv{2#XxBfR23X?ZDz8<3aY5b9v1@*C;fbPvU{!!kbYze#V
zY<#Xux#?PG0HT@ebPT8>R8j+XrO)5>7f~P*pB`@sfhs%sQ?D_|BItsC4)PWMFjJtc
zwv&oXQHaffqo#udRiSs(gFbC#+nzWong3aER<wIQW!4Dj9-#3gsJG6L-LzgjG(!BF
zCV^RP5}mU5?KwsuD)F|V8nZKfz7AwEGJwnkCfmOWDs+X$hVn5pF`ZlI@6JX{;*3T&
zRePK_Y^aec{bjaId<``XaPUtBPc9x!1LV4+P<d~fC)#u+I*MV4Mi$A3lxEVfb7`;n
zWiI*C*!O1fW&1qv`{Q+ht)@Z#a0--<i%(geOKPXmhzb^<sY7}TX!hxm&f0l`dl(NS
zhn0*?eu%0GnpVAbyDrq40y>2Hxudc>#ONoKfJz1N8*VDw#vxT1wA)qbY6`f@&tlX9
z9a4K#XMusKcFk=UTUDm;zJ7EhBn__8LaEZNXSY=AgqnB(-H*Jr+l6ybow7-!EGAG?
zG^Wg=BFiv!8(Y|-hx!Y{ejYZIg$mtj1$28nj>=xkXZUaw*vb}apiKh|>8vwJx-?CS
z4dt1i16<zL|5Gx&{$Z$ljol0_87g^C(0&o$CO6&$B^QWj0Ji~=^APAR3oekXmFcz;
zT(5f(4<Ap4n>E5J9)Lp}K^hNoMH3ByRF5oWCN@-mynDO$_=9eL121^?kG;#EPp|(3
zKRvSY5mZ0L*Xu?d*uP4F9)m|lw=N$^<o-~<tdeLN4jHc-zmS4?YM6`PyjjP(?zgPj
zdMc=Hhpul*@5}_;8&YAE1bT=cw_gEL;0Nj4Jsv>w|185CjIN4eC@&vKOT`re-N4$Z
z<z+jcmhQUw6xGO7@F=$t$bnF##sV_DkebC50HbnfwkLK#m-dDRL<3|XfpP&xYPhBP
zp0C1>dx9Xd7Scv4ULH~gB#)Cd)&W_wqmMsPe_Wdv4x>Pf@rXe+0oi8^@MbVE9@6nc
zFSdZH7j{(PvqE)dnY%uJJy1LUv1|KvU`5joq2GWsROhearSg~39K}BC0nZ@te+hV1
zj0-&H9I!l_>Vi2xkYJwXV4E0_Jxn>El=>}i&hq2EhJ@5!lgAfeRj)WIjJS^|H30O(
zAcyvj1W*Ezj~NvR5<ub)GyYvV1}n{fjuF&g0K(t({{=}nx01A?wn$lF<<EFuGN09*
z^opJ7lY6aZHw0|)!zQ%lunz_w(bgN@>)cRGlrmq&&0w#eOTeC5m9@76s$U|gn(Li{
z7x5og_tN2cIRvu#GHI&bcs9AAOyj0aooRoUT*CU#vUOGtO{jLD+y=z{*hB%X=v#_1
zpp{eBn1@Uriw@uG8vFNj@2N)6ThJ^%NZJ75c%yr_ucLH`FeJ3z`DB<1B+iv<;B*T<
zEo9^uXO1b2H^aOfM(?feZCcbm=57s?39Xu&=@uzqBWWrK-DJan7BdhgD;7mb>z2h)
zS5Qev<M=Aisf6`+0ImZG0{woq{~*JVF?Bj3l?;}Na#Qk4a$#Y2%0TLp?M&he`|VB1
z#T4bH^3$Pb{xaE+Il{%R*CteXI)GplFqzfQwSx0OH+IAafVs;ypa46xKAeRlMVEHc
zYDI?j)fYClGc#V1%CP+}Q!ufBd;+Uoe~(z6<x|K<^l4x~kuJ~`L?EvpsG<-B0-3C}
z_?oAh5Cv|r*Y5TYx3fB=0MP-&g{VH6ytIt1E7zwjh3SZd6wG~w8Y5WNT<#f^gLn*Z
zhV@3F<IDN(F9~@|5Rox^2I$Z~q0r0DKpDpkscaQ0*5%`Ak)(fO-;^%wk9t`o0JFUv
zWD`h#p|8IvbJ;Oi0~A|VJAryhBd|yAc|gexTDb;UvV7?!Tdv0dS(+Kg!u7Da3@I~F
zWgFA!S7hLB%Bfme62NSUWG;_VK44$}0Ytk!{vX67%Jqv~#%Gx_7x9pZgTx$zH2RG5
zE3toQ9^HG`&KDzB2cS11#st?caR-=0S6|r?A^Ez<!$okCk{+`w-gy<UuZrRTubb?3
zO>^ChEWFq4vbZbt4G>CRLGqZ$KF4M-1G(b$WlC#}1eE#4hY;4W;N(DTytqH56XHl^
zMzn3Hv(Ul8Rq$rX-1b`X8qs)Wit$rxkT-x5Uc80Mw)Eh{p0A>7DIheVSUX!N-RleJ
z!wFl5<lplWRpwENLXp4uL$E#hdm&X?dCbaw2?|114pP$!%==XNF5fZ#Sg`8U`(@Gr
zkL~$@K0~PX*Lz$$m6kPj5ct3!3~X8n-hZHy|1I%drlBshDho0s9Sm^)x0{r7ekBfM
z4Y1aB44fEhKQ*a77%1~LT?Bnaw~`#`OJ(E_MyG=zwZ0CdDT?KQk{PTf+S{cqbXKN=
zEDjYZ0a7f`<TKsD;#tmaFlxEx1`@KtM>08(64dkQ&r_*D_GuWR_AXQV3;^Bu2(mtq
zz}1uYJDmX>g1mG4s(kaAjtNWdf$mfwM?^BXdiclrv|q<URv8Q5LlvGa?fFB!Dl`E=
zqr?x5HlSnfcN9wJY6DOqq&h3D9{e@Z)2EZ!ZIKB|=I2O{Ox_F&9EO-l7xq`j!;Ly1
zL<|&;6ihX^804_t{C6#vdJ}s~V2Zt)NuJ1f7rc0&D1tU#`)~(8PCejIk<CYs2)sEa
zhe*Ews@fCxihwKFalS@(T(iLPy^!XFOMxcVD>xVE$4qw=oOYRJbo<5f;i>}$Me@tl
z9;#H6FHJ-xE;~a|35-cpkgslJY^pFrQ5$tt?su#K;6q}RA4TGyVkERox@Il^I*2#9
zU*%$gWd5Ek=6HD_lh%w7tjS+7HHmKn%!7_8fcVw6T#)kt@t<&DC8Qphg~T#o!iQrI
zEZQ}K=o&=dA+;g@N@y|&#D-d;)E}RsC1+oNg{x#Pbf6)?1yV@|Fh`5(fD=B@m+L4u
z=C2U$DVhUDPnfF1{fD;h&o(S?6QF(sYI-!8)W1IO73|w(R^j~4#ZeOsKhV&u$IkpM
zCdE9`BCwxZsImdVALO*DwnI5TZ*a1_9NLc-D$7tmUO&K!g-|5?T$P6QxDya6aG+ZW
zUxqJ;>h4{J9R(4-9->PFPL%-#kK&^`b3Yh?yk5x&3uKg>g&{Q{CYhQ;=_;4sl*^Kr
za=Rew&6)zdhdQ4M#Ep_S!3*4b!tfqV&T%NXe&P{byw;6#|B|lA39#Vsqg-I&*XOBx
zgJ*^ki7{X$sjO;qHQ)S;K=|(|0I*b@gqCo|f3<|glf+TP%zBVh2(t#<BlI%Q{M&ym
z%spKV_3i&-s4u+eW;-3Q&8tM)h30lS>D~)1w!qJatn8rv2XyiNFh?G4N(ol=uY1_V
zIOP~jCKSGa0@3@ezz>khW4j<7{F`q)C8SzPqJQ5vj&wFFx(Qi7?S;|9T3Y|u1_|U#
zU)F~x|K46+S+`M-t-<zACT#Ja?P9;dsbmUD6y$rN11$mTm?3`FvyL^IkNGn8y_Vj-
zrB8+YDNV0>%|nF}e?p^mRZk4m0P_=2n2WOTuf?@OK>md^bqEzo+&5T0ZVA%Q!9j^z
zEpjoLYyIWS4R)_dthRsPo9B5~6o6-AdqTguGpT3P9&k7BmD;uTt6=Kx4gz^UWfg7$
z3v*g^{eLl!t4M!`Vd2|7f#8;Td-(ZP;7k2of@N&YSL=lmd_v->PSJe=Rym-N3a#QT
zL7skxH?;KKgmPP&3SFdwbkOc2Qu$VEm?q|1A#GcE1SKM8KnMpJOki-g8QJ{;>;*Xh
zbJy_PL<S+U1Ps=$mv4YrsL<LU69)<ZU`3s&2Z^W+iwAw<neU-2;D5xg!m~j1K<zEn
z4$AdGX^K_F%9<X8g%m48<A1ky1UtCS9DX=JjZ6zP5pf4<4B`5}F|AbKfrP&K`VR@z
zHFFp&d?1F&2V`W@mf}0pi@7sG$E5{J+^G={icEJ7VA!iF8#kG38>pC=y$IDHp;ZG&
zAa>QX@iL@sbp~3c$sazpVGModrr{yuF=Qx7X}~}G;Bg_~VnFxHpZn9#Q9K6-o0YV{
zqb%4&VH5csdaz0K8y$p^NJhXx^fE(hG}B|vjj03C;hqqIqd=3&L*H2CP{hGr2Kcm9
z_?Z=P<u`u3O$Oqqv;N-ip+yW}dx_RRv!xkK&wr5M#-Z6Z4D}+W0uUrX3190pf5VnJ
zm(G36I@s4%3xz9o;dCE4B4Ga!37Xm@2w~)<7k@}+zeF)L@q0bmBW!-NbpBOFXz;Cs
z3Pa&&14vuUG=eOoR3$?NS_hVuDL`I<60d+cJ!*zLpeCL)=po-8f`!Wi|4ppcRHEhF
z0|n85eJ>J9+9mXE`BCJ4(=nZTaQ9dFjZ|r0#+e6y-Uyf`CLfc_0v5B50Iv+G4HP$-
zA)#o%gn9yy4F0+F{}aV|NKd9yrBDvWo2e@^WfAYqWM3KXE~Q8t%ts5UOr@J)Xh)#b
z&cZOiKkWtoD&XxE<7*GaXV%XEhk^^Z%Tue>UI|(k2*HI~*F8__#J-2pzF-{@TgnD2
zg5|2e9Wr|C`(AWplYt`OGmBTugXBU?(@Y4D_*;b$)m39-gW>wwnrFi}Whli0#F7;W
zRfk)(=3@C5*6@uGH%?rihT7Q=8D#LmG%iEDlw$J3dwmcQy&3Tw6;_!ev}SOQnNV&m
z@9~b>ku_c*Y&bvv{sFAg%xrS@B5374Ag!`ZNDM$fz<vPH0m-pMVCM9v{KgCJ$2C!C
z_R%E~GFIoqU)hC$Aa<Ee7s#^g>uLPI$!d-f9^FOe@{Y(?-q_U3e)PXUY^q!F-Z{{x
zCM-C4aKhKW)`ni^TM0uatNzvLU|^R42{GZ6IT+=Gkg?TKs8{sYeL)`clmtGGfz|)Z
zu24!1<$s~N?<AX;D-r)&r2i_}way7>rCS`&t3yVvf4w>61zc4-IuAy9O`N%Ikm|T~
zyD%Egf8HjNrvgG7;KMp8FLVAUfuh--hHC!e*@*k9e7Aw5$xMPgS?)HaKrQ^em>R@?
j;&3Vq!Q!$&4PIfazAN2+5BLunM85yl`gp-Hx9k50O1C*%

literal 0
HcmV?d00001

diff --git a/img/result2.png b/img/result2.png
new file mode 100644
index 0000000000000000000000000000000000000000..2d0102f6c027629ceaae0f883af35c28bb12711a
GIT binary patch
literal 16588
zcmeHu2~?A3+IEmCRa?`37DYhP4sErd;!;2bk|Gst8AWA@tf@mO79<GB7D$2%rBx8E
z0#gwXsUikK0U==xNCkyra0w_O1la-sk^l*T5XgVO38?LKna+IQIrE=0IfsPgO`dmq
zp8LM;>$>i5_U+yE`V##mC=}}TPj-KN0EJo*4S(oY7r-Z{`jS?{i&p4?T{}?p`-X$?
z<`qBNJ+>%RVbW6Np@r~%@zLFGp(xa{I^<8QA?U{EDAY%XKKa<zInsNi<4{OX``Nq)
zR;vB77X7%tX1#qbE#=68_oiZobd1lRvXI5BGxh$MH;aLR)Q?G)0UL$t`b$jD0+eJ4
z@=ReVN}XO6o)q+&lzmG7mNxfdz(Aptt}{yu1P_~NTTm#LtLiql|LW$1!r=*%iq4?9
zk7%BUdW$^1dXQ8ot@cBqDEYH-__Et)kgX}zlGEH)yb*by@%*qB0&SGUYBW#>RnsR8
zGo{ZT)%<JM$W*3nrWBn;Ztee&5$)(EGi8f<Rz5Pble~rs66LYn!uBrAE!@HIFp3PP
zwy_;+aCp{Y-D+u<KFYIi6nC(}RgkBk_VGH=)q<z0vuu%eBtc=_RC-=4tEk_BN#40f
za(U0fK_9kh`<wVLxp#xj<_`@{Tv+`Y(UL4lG#9^zzvmK??D-ykNIt%fHCrDDZ){W@
z?wad#bHrh8q&Oe<<uHt4OGsOEU&}7v{h>e6n#*irsb9pr6_B?v<i`GYh9{~F!y`x=
zOil_67|jFIPeNDuVlej(B{V3;jLU{*OmH;Tgdl2wVNXAL&Mr~cewn$+sf>#1%Cs|$
zT~pqyYo7LQK5^%@Di@O1`Eu{d6<#I#+TOHZrf=8xK*wCCvTd@yKiHSk#I&l<FT7GX
zG-DCJiSlIxmGKtOq^hIePu4d3E@mJg*)%W2D|%q|$QrhM+LW9n*jR5iBEq}DP}nOa
zq7I`PoD=3w`Pq#jdOo?;w~wDp=j6MX^@#Ks^|$pL#L>%qVp<|O@E_(LTUapj3AUxp
z1b?uv{Ok{5M+0bPa>M$`YrGkgq3yTtqGq#&Xxq4xhV=(Y{Be49OQ@cYn{2aaqEN88
z5sUp6PI8$v-L&Y&;*2&$yW`mLYS*&cceCo3=xj?EJxCD2vqK5N)<5s)IW6Tb4(7y?
ztNT6IH+BhKCn~S54wltS)p8QKUvOz};+sqH%N0+GVI*{v`P}Sn3e<CZ{0cjOoG-Yt
z-*dI7;BY?E>oVqM?%VozIEr)HoqOrkVS6P@MT7%;7Cu-Da}YDao4wBBPHUmMRz7UY
zXCf=}rALjpkGk!WXVp23vS(Lj$XzGtkKN(54v9f|?9t1fBk9Xa8ILQ=Mm$`MtK9mo
z77eFV)c5Q0&vhP>C>M)Y)kx7eMiNf(*~qBf-c3f9_4%CJ0|9Vu$i1d`a4nyvH6l0N
z^^L@C|K{kC%U3*t0;b<*ydKM#K;v$qv5MM~%ogJlf|Ba%h98RD*Gs*(4Nq_l{qr`C
zMYmViJ$QWZP;W~EjN$#@epj^EU%p3_f|^}Le*cb3@d)Q@TIuyS9_z5@=CdVnW#!|^
z`tBGu96sOi=rkv7amn?!%S!@E_Enu2aDBSoSMF+-Y$dA=4Uzp%g=5EhJGl4cJXqzr
zBd>8i{D0J}3%U4ETHU}&``~0x9y8F@CKf-GS)b8F{Gi7bV~U?VggshmA!<Dcvy0+d
zRZ3rC>b{nU+3Lr=$n(g~E2JAIC>K;DabFCc+@3r1s&PaW)goSBcZV6~C*DmRiNE5*
z@ao{=^_;gD@-&*Kb9fcMU%MfohnN^Pk~LjCW6j#ix#2+&HZ^W0#%&6(V3hirhq>rY
zC5LBLczo3<H&h&S%X)OX@k#FftVcT}F+Jg-7o|mlE1R4}zV~?9p^eBs2o(K>9T+&r
zVK@6N^$({r(1rzx73QsBr@YDytP7&VrBBCG6-6NfJr?K+#@VKFlZ%1l3%K!Tuh%az
zj>o#vH;%y$3U9YeXEd#a)vcF3oRTHCN#*@d4eJ5!oK5O}nD@y2q5K{F*gcMT5gGbC
z#Gy)y*6@a|DaxT_WG1Bad|}xJ8wg)aw{$wwA#@bpw)I|RW$wyc8^7sOGt9lBK$Ox)
zaqu*)_vR{c-vfva+cY!YKXg_re<9pqr)w*a5Z5f9{MvwVk8|}kh;3=S%{NkA9?877
zN%y-wu6#1_!2d^%w(rqs>KANNpPZz|tM;D0Zdr2ML}oc3f38E(gv2^t=9bN|{I49h
zqEM-i{&7X1V&y$l`A@8vMW`<S|Ikd*r(|E6if?9}P<f0ImZN6Nc&s~SlLlnj)T=Un
z;q6o-Pi>U7pDaF-li4R6e}_GLIg_Uo>v)Y7Q54u4J+mR`!|LD)j$Pjm+@R2wwRDlg
z=*xK_O;AquuJU~620G&ct<;R{yu!RT)I#^{mwP;~1%`gq<RwnFLvF>U0t>+eN>c4g
z&3_!<SXJ-_Y3j3OKGv<Nn0sDg{FH&B$rQg8iG9Y%yk~n6I-7U;N@5E52R6VufmkZh
zlKMH6CdL#H+(x97G&`|r0>o9<nMTnp@q=;~Qdu*<h2ULw+oY`|Uc?R`i(#=It|Tq<
zQ9cw=lEYRX>eY51x<8`TMb4jfmr;@(%%V4NL%7y|tMpH}CQs@O8ZayHJd_M!yR|ky
zzq%t-uO~HJPRoPEsErDLjA>l*u)$?RRm{8b`lf~hR`}2NFSo`B(~{vRkoa7umn7@U
zsMBLPPwRdU0elte2S=*uNx>c`H``-0W?(=z+W$0n537kb7k}J{b$746ABpYd7%=2j
zG-q`LZjCpTgonuTLr)Nns=oC%`Px2sA*$xMA8ShnPX~o^{IwZ4OH-N!T%fHSJ4saz
zI4z4hopG>(;v3<#<`pE=h4qAwwgfw5Gf6>Q#!Y)tapO+kr|TmUn>SUzQ&rbBwY+nS
zgfBzmGG7kN$-EM?CO8=#-s|L!entuTLRBury?s7NmT0YPyT7<xR$3Yq!bL?cRY~fm
zy0S5z(~E8X66rk@&}iGUA?RIz0!L)&8H{6iQgO5R%jspioFH}EK}6Jx+G%xCTt(wq
zmU%2-UdBdu-+Vd&!PMhr<YmBE>g^xn6I?B*w`>)!Va^DfPq{n2!Q1|W7uUjroFm90
zy4)~yCGW>rufdxYPXEZ;EUi|@79{rnP<7275DRklDx=bE3E0DL;qM`dlB3Q1RP|Wq
z8Sb!(p*UD}8$Eu!rzDtB56OP4SXdI~vbEI9$*H508CV4nMZQLE_~B_<sS^^rkMkNv
zkZ7ifbDxeph6q*BiA%FfT#}WF?kB>~r?Fw_K^;dN%<qiM^qZ_q_7XFuYDU|c9zJTg
zfn%HPH5axXA8`*NiAdDT@zvRHgv`*zJ$DOkO?S+nz>@S8uJwBp;pGGzLR$9ssWv)^
zSs`W)BBOLC$S$;)sa%7l<l$}7Lcdkb2p)N!V8RE9lFI%n?iXyG(txT#1W`p)sW!K{
zWF1Lc`2>6HLvvR>_*qEYc|7bv7t(^K{nG}x&AyD+s>Ef(DJVJz7x{-_`U{VV{xvXo
zY8jHeHgn@AuEUTBl+lF$o!b)jlcsj31ZsEfl#VWk+ptB^n7uL?@+g8M?{WH-+U`ps
zSX}>f{VA-;nM>l)H!X=5Xw3!#F+MXC&5h$s+Pj-S`wW7KSt<FJez5GLRUMs~Psbad
z3}zSIcoXmDI)H#_kzDs(#%xF${75cHc&*E6^b-igA&PQc{7bM!{jY?g6lYAO0_68h
z4Dv*wypO|kjTp}lUt&v^T-NMXeSpZKS%He>-=sd1d6J^SV8pi5K@~hRT;KmS=${MK
zk+D?#WS~~8*~n~uOfA2K#%@^pSo}$xnGJIhiq$Mc_ua%baRfc)88hO^VJymXCpGDF
zH6rdj47r^a-*||@?+47sOYJrY=yaGz_7?20Y3n}^;!!btVZk?wePwbrAo<gPz3UZ4
z@n5+1)olfN;UrdbmR#4q^Xz+s!bb(eB5}%9k87!1Wgcf6yI;GonEXkc3q1gxK5<eo
zJ(G+e=I3D;)8ZaMM5Fi&MZm*p2*tx?N16i1zaG80DWwzlZ6=2>eIe#bfeZbIMu_%9
zU9GMf09`Tdg5V6TE@KX+=vRVxfvhC6SDTzaH;F^^dI~ks-=B5j@xf<rYuDsF<QH{C
zJ#uz^gJ(kIwhx@V)E)jvJm#;N&n_w4jT!{+&bG~FZtoyGa1XB7igR|dh3FxBN2fB~
zlRR{}Yh?%P`%4Ib*Fs_2D`xgk8FFn@joJ4F9uVVy{-`unHMR8$<CI+(oZ_Ng#?>_|
z7y+FX!4<Pp6`#^A;!pKpBlprfxfA&}&v)j9>~{-q^708y2-+>)7&&`N{+cpkrj9M>
zNx~kCR-SW8Xh;kWSO=$KP!|2Ycq%ZE|9OxJUT@pugUA7zi%UXJ5UcV>(mE_qowsqy
zqu9v-oi@sjq*tLRxfIgEq?xUa=XsY6k=Z<BGW&lon76wuU2@e!6MQ^mUi|$c1f6pn
zhOxm&K$;6xx3(M!%6(H)h4NVOfy=Vd`gf2eTIwc4(I4W%0AL=d&j<J^sf+1~4D85P
zgX%m|pqH+ze-?d-FZUIQJpn(Cl$&K2{F8wDs4iK!ozHxl0y%rS*<}M#=FjJfiI$nC
zlnlaU|Ht`W?&tKwOcR0+^2n9A!@`>z$4p1C5pxG$v?C`jxzH&aUb?30NBY+e`m$|(
zZgez#Td_-U(FNUQLZAqt690X`y#Zn*ah%S%eUe;FqPw`^<B9^kKbvk*7dx8}%>5}J
z4S}7+N2+NkPA{r6NfG2$S5=ox9pRC*3x&wO0NwKa>PiG4+Iagx?&^~Q86}R2V4k~X
z#pJ_tv*Ov?1qtc;rk)q;^sc2Qeg4z}<^3@R2lb74c7Zi%|0+niY77&2A9tk$ptt|c
z$2$ffDo+_<f_p5=+%Fb+EJCWLxnNp?WeE^MVEk{~T~Mf^FV>FCd}jl@fY`4eoa`Id
zsbk(Pq!4UFhRhg9&ZgeKi^A$=0=csx=T{a7O5C6leMg;o4OPRLtY3)g(nX$?6j@--
zOXZ#V2;ak7617m1`HGd^>}#p`IaY=Nz*5iW>4*zdQC~bKYVN{B%*OZ(k|9GV-GS{1
ziCc;MU_JSnE+fCdT5)9#QzUx^-q%5OMRaqQp<<f`hg@Mn|GN)ms*>=R3w+#MteGok
ze#S!moRj)@-z`C5Q&kySnKi5ul;j&_>hL8M>+5;K>)##x=f@4Z@=|5nzt0L?^xKz7
z_0_Cc>l@nifsB!pP{DrnAR%~XK(|SmJLVuPpoLE@u6mays!I$2MZV~?V27o=n`o%Q
zPXIz(F^!7N6jBfF5+%|P^w}=UUWt?-dq+g{>f$t0=ViuiOepS1PGxlRI!=TOprC|c
zhlqeZ_}l{*qql_w9UE!Bi$V=i4e?QU!hl=po`F7-RBz(=6%Sy_5_P|~k2^Fh^?der
zd{5z#=?9N*ykSp05;4+L<hPAT0`|w~9!iocWvqjc{4Fi6C!JSOWqlXW5d7SAX?DT>
zLwZ&=P}+FVD!7yn%}sWTlSb&WqWDG+ZUwjhO;R!wxJFadq~~n(gl>>{w7&B`v7m_Q
zB_;Hio8;xKuqXJSfp#E8U1qpOFlG+>JL}yF{VZaSZ!nj{ZYCCNMrw%oDPPTfoDKR8
z=sVMjrUqXi_t19Y<T^bDau|gtq=ka3MMG6%twK>LW>2E=Zo1)9uc5wCUXe#*ZT|Z8
zXOR29Al9)>bt8Wa$g1KaX)R5VXFdBi0-*-rKUY1*!zPzy4L(mNvVnc<yE0lMYESiL
zhjd6G_u71`)rGsM`e0ad4R!jw>5xv<cOk)0@gx)?U{;b%{H7FMbtBYyo9M&z!~<oi
zHci2gwx9qd)R`bi<z_N@nB2B<8T|BgE3hmj*dOc{K3G4vhYb}vIqV{{Jh)=pk9A*k
zTw5I+Mo1Z1Zw?bheGPweeo5X}sN&w<Je9r$6=O299zmb~yOaFqQyzJT>I$6_uaYcQ
zdMrg{-lg87PpQrzcl!Te$EdDHGMxYCV^$Eae(NC#mr_l3d!~<+U+8-n;q95;xN8kQ
zXY7F`k=+w|f#x(d&?{V!YGg#W!cjN&3!Slw`jMy@Vn~<?2H?wEESUjAFj{6wMA*gK
zPW0KQWYN@2ZwC7zdw6PH&rh3XJ#jw>iltkkv29^%n!*I~3(?r7t)U6HHZ*);=BEtY
zok+HivMjhuFUh7P!K!U$_*fBhdvelV`i4-M6MZWyGuQCL4AH~7I$gogUxU^AO~0Ah
zG47`L4r<B|6vu4{&xGRzE&Sq;mdMkTD<LhD*K$&V1;R{TPNo?i*LQk+=&uVO<UjHv
zMKVRop}i?IcB*N{0Y8(kiRs9=904J#v-re7>j%P*;Cp7sVc=E6l!mF=@uxA0g@U$1
zr~p&XzMjGEe`JQ`*Da)Dah}qzw*zaJQz7cTQg>3o-XBy!U*eamJ#<s@^)L1wcKz`U
zkDLmr<S1{dEqz^PboJg8{ji~rSFX0I?EgUUFdBLH*7kh>9On0porx(^e1N}Pumw00
z$B4ma&&tOOtlT!(s20Y@V@)#qPH%~*8n#{Y5I}-6Hg4H#Wart3PEE{E8Cw*}7O#=V
zq)@(K`>pajJ1T$+lz9zGq%yjd8{LY9T)F!1;EGc|WBU#IO~m{)t#&+-8$X?C&;Z}A
zKkj2a@p!Xnz;6wGZ?~NRf9p5sz?dFutYw+{rtIy@4(iBg5WJ5}l6xGO3OxpEMza!w
zF8>&BQ5|fQ8QnASF80=F;`n3-#GB5};R-Sn7nf8W9If7V4u8S)*XCk%Ppzu(QtJu7
zm<1}!9+o~ThWicGE<*JeaR#em%EmAKq_&JtQ<GA$s?!asSPEOHbW!CM->)t7quvJ@
zV^S_HOAa*V58*2>dh!~V9FiJiS}v)V*7N}qf8{*Io6jb!veM8|Jq9Bsx*ul)ulKZn
z?~K+9QRB~%R~y=JA@c+PKgy)d<=NY*>Ihd@Xk9PaZ7j6wGcx+=MR`QEqek@smyht$
z`?7Zolnpgil-+nOLoD-X^t}k6ZB>oKV9y$)G7@h;IKTi<9_3r|XqxAVk24D$yf$_e
z1cj8LoBNEu{9c}HYW;Vhmu^+CJWdmnAv;-0Q}IZxgAl;!)_ie+G!EgPZdDL`y>{tM
z#kQ7*Mx#=#Chy8TfTXG{Y9E{-(rLF%AQjaC!{tt=?TGsRd?%hR0UqwTq%qH-g`LVj
z>ES^xdr2KxBuSGwMneQghI<&1(HQ1(ux|;vf1gjBPl;<5H-+PT4uRpH0foP{C4#P|
zw;o#p<pWm$vganFp(Y6al-vo^-M|)XjwS5HL~3Yrvabx0p#Zd%Z2KVzC@RpV5L|d?
z<T~FaP4{CTfkCt&y4sw(4w#}8crS^$J5Qv^+4<`F3mqk^A0dlPTz<3enq-q0tcBtU
z%G>POh^TN3in49S?Jd0OBLCBnICQV-)IHr_Oj&HED(-NIYzIY>gdsP+<M?3t8LqjQ
z$0X-P05v?EqGk@N7*3rxmo3h4?6%|gui4i5(+kOCD<7w<qADNg1SDZXPLDD-5fkI|
z)n|{e+CY@^Tb+W&BFA&HjUpZt^0O_M+f)3wmSusl1QBNTA?{Zyu^ffVvTQ=s=K?-S
zxSCQ{>9udUHJ?cyevlMY9ozZSyzWt>^GJM)>0er<AIxce>x5#SA{W+=oJiH@AG|Cs
z8%>l=FD9}`Te4c;`j`>UIdQ^J>SbnXx?7BvuI}55kRnw-3cnHF;naz7%sq4q$KZ;C
z%jgHpbxq<Q=p=R{A|d2akZR<h`^=$7VxMNCNm+R?H;>dcF6H<Co*DuYUf_Vwsy&F1
zp>zxEz{cFqOq@nEks)99p@fG`8Bo}BLtFGr<kdR{`q1OQM!jY3Vm1F0)Z2#jyAyS)
z5;om9uOCK3w29;)q-4v_n0DsFe!?W}lmLWRR&GQJAl>cjUtxnvgdE7rbz4k^88z(>
zg%YH0Gm;vwOwLMbL`vKOSkq9sb#-NNJ-F{ni~N8-<}(9l^eQL;z(rHP{S8j8CP&C>
z`6Es)s!Agg0tuJVj8NUFtI#7pY(z*z1VBro2frc14uda~j;)FE9fs9-)v$goaM?|z
zTG$LqKGf5kgzB*YWZh|qu##=6*wzz*-kZ4xmckia?T?Q6F_GKrzyCCMr#K5}S3a{!
z?1iv-`O>2}An{fjB(<)k6FWNP^rAe;>!f^UyLDj^=xD)do+T^KB1CFQVJnn@#<0C*
z8j2~N*mO5>rq2Sfl8C)(Rn3oUUipoBs^)}hG&m%z6jHhaKWYvd%;A@NoP`@~tUV(r
zv!DIM$&ERt0W9<A<{oF)sD~pRlGz1XL8R3`A{PKAY6#;A3A-(w?<i7Z6%DGH-{vHh
zt5JvzuKOuj8OCGpU2{eQm^R~aapR0**EKk1FK6!O1(I(B@-5M`Z_U`qW8(bS)Nl;d
zYo>TwI^HMDIXc@20Er`L;y6B2`rtFEB{aUOSb(cYVgag}IXiw*P&{?)K7k21LN@hG
zxXY7Ny$p>&5}Xn@dTj$)wcR?B@{^_af(nJ7d{8q^^3dKD_o+W}9Lo^kLrH9_RQY9&
z4P$4^fA*ae2R2JRY@bla>)7nhhU%Z1I#tDJ(%b=dj8EUwfCvCx|9~duKYG4xQ{W<)
zTNn|Qj^QFOO>=>+Wu`N?tHHzzeBg}T{v1|ZpaEp4w|oh7{Nj5_YycwX@Rm);(Dwyu
zw2|gXzQg^8@Qg(3F85hN*eGjg!GEj(hY|~Gsk8YdU8}kn3u>sf-%xwPReuxB;~nY^
z3dSU6u+|(ExiU$0d^&?OMVoa4AVeL~_%<dlVex7u?sV$6G!M6T5-1>LA-sA>7~xa#
z^z+y*o6^Xb??)12va3o@fa)Q);&$ZXx~k@j9shAp277!csN;QDx#R47^SCPrlh|I3
zNTRQ>pE_^7ZXTRm+N`xcq6!a?bA@?BW&35Wwxq!)O(Wi16I(;nJbKQ-3=i&vCkKsu
zBENrAmKB0V_iwECAy1v}0BsH7V#lqe9>%|~=!ph;-uV~7Pq89^`Yl>o(x~fNMz=Xe
zExqs?baB_fqbETwh&1h=Bd;i<FQGvpkJe$7`osTy=j};^vfC%&Ol*5xeAZP_-$gtq
zYo<OTfSc#nwZO?#MUF<sw)Y;ia_oZ|JtR&i6w-O2JFO+K$=_r*&~1?$Uy=#`kYS!|
zkRI1aRIPYd7C1W)>MTur`i7_TBDg6abvShp!S3Q_3pRklh-!gHakE;jw*7DsJHGOg
zCT54JI+hrpxzrVvUm!!`ZQYD+zAod;xSctIecdr3HQaj~#{I>V+8GD62ShiPAtPpT
zBBF8UBBsS-M6nL4`U=jYTbMcK@d-Wlb=B#2e<`CdGgJ%x{sRG#82mNS|EYi|AP)>T
zbCh+BV35`P2b49prD5|W{h@ZdsbW%)RPB-=d?pXB8b*}0r{gg9qY=|nC;rtc<st9f
zbi}LFHtiP*9xLfsZAU(!t^r2bcw$;$?saAr-xI7jV1~kM^)`qI$O}O8GDieccXI7{
z?bjCOj$TRKw8;EGHZeIcs^ziEp<cYZjXbwH)dn}zRWj3R5#I^aG2*^3Ip+RqMo`BF
zqqe4ullA+`Qs0Y6y8i*qXwsT6YmpR(odANTIN=M>(rxDUH1ul4G0RBr@y@_vftUNM
zWb1)l8%&_iZCcx~)}>XgN^XrDm}o6sTs1rgQ*iZkzI)%prp#Vo&VAw#_XuJd*=YY1
zG01GFcu$h6FgwQfy{HyIL*g*~+E95I_$C7AK?M1N#1h`7NN+Lz9EkLwSI7B<BDIij
zy&d>b5FZJ`d?#{S<;V&KYD@XaFN`IzNjZdoKS6bOhd+ou3>Bv(Q5=mQ3MHvyrkRCN
zK4@<ULh^NcW*~JBE{Xb^FHjEM7G?fshT9-82l(Xwp5f#h$5(&LZ?aI;)6*+F0(d30
zdb}HmnwK-{QcpGap{)J82B7?WYf?8OLqq%!M#Dqmay$W({K=G`GaxQg(>#<Pi>D`t
z$}`jVuFx<9zI4hGLD1kYm>b}1mb1lv6Uq-1(W0p(><raEf)b!<XqmUC8t7P+Kc1y}
zftOYbbl865gO^!Hffx~v*Kv}V(wNmo)|t&Y)JbZ$gO_49EK;KUdr;*o;XsHy(u`vY
zm*%qSYg%RqLc=Ka3!+qPY#)N$e*T@*461tACJwrMKzZgY`McCAl^;ercYtMT3d;dk
ztYNi~e?q+?iU4WiG*<xovu!@@ufgiTcBnjYr7td!1I{Wq?0+!rll7m(9PTjy2JPN2
zKq`DR&#C;{_lz>RllAWu5L0+C^koDXAq<V;G~-v<m6{SIOV~|q1JB5Rsx;EcIjK^5
z1k{2pR<&>qWqgE^gdm~CsG5Q>nI#{%9yDswQX1i=cKVDS2njPaJ@p_d<|9N6fJ(t(
zkWAQzxIPfB088~9)*zR}pj&OOYVb0b3ki!D@oMN&Lv>a;JqaD~>04r4AWhE+@zPxu
zG6+@bCL@C;pVyK;yoz;pWzo#6zpdyj*o>;7uF!Z(b(YS!B0oVS>oj2dd^c1%8!aOS
za$tZ)<3zBVB=gdF2aeICA!+Et`Bn^_Sk;Y_xVWGF>W4<q0bXWtY%m6CYMh~s^3GT3
zisnR4*J(A`AJU0)*DFiXJ<9=moQJEEt>Ou|Mvv}Xgi>lN?A8H!YyeVJ9%ZMM`eIn<
zOzcPaq~csCsID`4(hC3L6NiUme8e$q#&v=2$Xrcc)bZ7MEmTl1Z}uaNxAPSRX}N~>
z_@(mPWiv@oypK2Q)lp48$T1vy%chX&HQt%XZ6JY`1~Cro8<H-Apy7-1T)Pv33zIF3
zsZD1sx71sHAE9SWy&b*iz8p;zW2n;F_MZ65f3qegc=$jadH~!%h@41MzL`O)Ye;ik
zEn}WJJ7ZM!-NrF1ZuPxDZDoi`k~&+v3&)&TPWo6<+1hsTWW5*Jb{j%UM2kqQMzJ_I
zV!CfE+;$Hb7$*vM;i{(=khVPc5@G(zdh}<!M2P$x(gO6V+9)Hm;xk!&!uMPqoz3V*
z6jg0tNJ-Rb?wydM$v1QNX*@)7-=m1r1eAEj3x|;@;NX`GMwvM(3;Aywj1K0;l@skS
zJAEV_`cN733@>J>-A7A@vGi0R$38WSrnpiA)r7+|IE!#UnU)~_BN0h;1hGSVWB*>^
zf{rnov55F%KWN3Rx6O^<>fyoL^AJEV?KW7ANFpaP?4-3eU^+i=Syh3gu5xp@zw^MY
zH=w5XvWBC0*>5C?s#XRX{gL0O;?^6ANVt@qeMKIhvRnXJ`*JI5YV8;d(9(R_U~{Vu
z<|;OY&$NQBHv6txUPdfO2}Ot+)JR+f>h;t0#~nG;tmqBd!@yhs$Ee(hxlyu&w>AK=
z;32R!FmL2+?Kny8%BWq}&`hMm2G&oJhe7rR#u1?#k=-CjgxPp46?YHHq535&`!?DS
z_8GgCzAhP+2CRoQ^o2Beml>GQ=Zd1{DV<v@AfW6?28;p~55LEl2=&pK1GiQoSA^xL
zsk9a`{>ydzm+Sa1*YPj4t+Y_3U8_*o$8OXn;bkNl5E<5z;aPfSrX+~0n5KR@tD_oM
zbuJ;0j=qla9vQ`b{=9vKU5uTX!2uN_$5x=BunFCurVR9#&O432PqHaEybH|6#tl_3
z3#`+dAtTmWwpOMhkbt95Ha<7{!5cqLfUcT3@t=MOtmJZQKc{DZ2erA~Lg!Y;oJZVn
z+&`3v?ixu*Iy~2n!mCcL6YXUq#^j#TRb&hjt$K`sJ~&9Ayrc&)WTA-6@;hec&P!Oj
zn$w}X-+(9vA$JUHW!jwqF+StWBB5``>YmnvEl*^WG%yzDr$oODL2RyNI{l%|xiVex
zHDY_K({qsNE;Ag?Bj%G<MKmzYS0KG8;HoR+goq<T!6Q|6+ZJ%m{Gh+4`@~wwbgtgE
zT?W8Kj5s8=B^2htVDk+;2+gdx5AF(tTd4&%^gf`H;uT*2dO}E$UW6A?>qs05SO{+0
zE>e$&&{JnNGs~0JchBZ1<tSLX)J|aN)i{NnSO?Y)JMTS+VD3MjhXp?^Vk;+M9>2vv
z%PT5LJ>fGQYJ+qMwl|h>ffkg$TzO(TRqeVnMb+%8Py{IuS{03|(P?Q*V=8i#u3)qH
z`9mq6BwYLlxZ|z1F3IcHCu)oZV5q1H<lodEY=)!oWptQZG)#UaU3OC77|E`ow&9d9
z*x7-TB@O6pcOpCV7>e7*fXc|qsNe5tk)Uyxf6>!I$u%n|x^cc!Y0b(Ru`=9)%)0rG
zlWI9VoZm}a4DQz9Z)obCpTIpD*S$KC5j!?S=8h)bnaVKWA7o{AP0%ct`|q(mHsnBd
z1B8Moa0sVIt5&;cQlF5!)oE9Qix2xf={zvkn^sOma}Dh=Kp^!B>jR60TAtUaLehqc
zYY853EYITSJ<U*8yUE(iO$;Bot5pNJ&V=EID;SpC1Bp!k07QjY`Gnl@(oP=lg<2fI
zR`E8l(1812gxHw}oZ6=9n@gR+bsa<x+5Z$~{9M}!;^LneS9UvR6Un(|c-L2}FvlE9
z_dH4AtUVRTZ#Yl*QeIZ!J3vOj0%$dPFC-hwU7wh#84~Z54x8;cc_b8mYRt)U1vpR!
zeAt^WfnQYq+$uQykk=K}9L;FXU_DO7mvKiJeLzTbG>5sY<@PTuMX!Ew7k-12hz*dT
zz5j@ls3t_d8^N7rf^7Upy)BhrV<|B4{Ot)*(yN=*t|GX@?U$(^1%RuL<D46(w$s^Q
zyP+GeWbH}BQQ{wCoM@lTL_G7ewKvxJdmouT46eH4o0(NmxF#1q`aR_(r~3k!>3+Qp
zab}WlGj5itg<|USnJ84{0(g$)7gUeDq$$psUxfARq1Vwxb$bYOCLxSiz+p*BVJY~m
ztEg(E%eiwOfy@nn^pF$@C#z7g1RC|33tiHUY`tby*<C72-i4W$6ThW3Pk|qAZwyxp
zb#xn<clwtr7!?^k>({bo#_n)t$+qT^PA6yxDW0xLl{)BJYuD_&ukdgZI0GAWtfKF@
zpFCnld5Svph_CXvN4SB*u{8<jdV{LP&?CKAs7eMdl&z4;Rm6;$C?wy+C=46_rItx>
zJr?bFQK+iiD5IdCnUrns;JXB95>W{m@v<+5^6ltfp}GxB({>k;3Jeu+`_4v{Y-8w1
zZjHWq6Ix%g?Bjmm%0r&;29atnsKX*#?1RiV=tV&^b%cX9>_u!@KFSQrUG{iOP$J@1
z(??oUoL{wxAV*n3^c=6EH~`{?1{>|kH_4YZe(^u<pfvJWFQ-_7*P+RilxuC+LGr})
zJ}1cA?c{z|QPq6H;8H}{|1yHri1bou<%dD9PlhWd>-X9ytxMfSFIy5CWOkJ2oWAjq
z)gA3ZwO?Rv)XlMICrlU88VL=y0xxyrCXy*Z=+s;bbzja)g!~SK5d0%^_vA*I79Ht_
zgdQ=Xueuo)eHnwa@~NfsBhlvIScB?g3JfjCLTk6C{mh?GH{(heLKwaHX;XJo;z~jM
z?<A#b^x3p%*%a6i!1_Ju*wU87RB)84$Gu2T^ve&hxOQ(TBfW#0Y)HcPoy!^c=FZ3^
zx!OC{ZfF$aL%z>#uXZtim<HD5CSqB@k+Y+(53XLs&Xi<mSqm|gjGq<Y<Y!MiWYvP-
z>*JZ+4ShVyU-a?Nt0hN72(kW~&6S;Jv9v!^b1M!IDDM`$a2JS{M>K&8V!kh^ZXyL7
z!D_fR6aA!rqXJqO5D#w}xTU?Mj$g8U85e_Tn%YpqW&?J@(Y!stFB53Vxp=b3fQ(SV
z|4inI$a4HrU;x=_PjED=3@j&Y(}DA?G)Cn(E_?ipQ(}2o*JmTS9y)uxphNW<Pav9W
z0dgI<^}~y*nP>POaPx;>OOAF6kq=xh5^7bRF~eQ+LA;ItWU^Nwu40|DZS_2Tuv%~6
zy`Irl8NnTn>WdU~iJ0d0xkZ|Sc_Irum9X5^1{)YYZzD`}XcV3Rv0k0&d>OAuycIen
znh)nXm_T((EJ8>GbrV8;yGYNPZzhHM7!cVXHR$Xa>_IG-|6E0!X4x`T-&q7skXC_I
u9j5+NmZ2`pjQRh|(tR{bH6vDOop^G6-1W^3MaTmEWar+G={r6<@&5oN*E@Is

literal 0
HcmV?d00001

diff --git a/stream_compaction/common.cu b/stream_compaction/common.cu
index 8fc0211..ae96953 100644
--- a/stream_compaction/common.cu
+++ b/stream_compaction/common.cu
@@ -1,39 +1,46 @@
 #include "common.h"
 
 void checkCUDAErrorFn(const char *msg, const char *file, int line) {
-    cudaError_t err = cudaGetLastError();
-    if (cudaSuccess == err) {
-        return;
-    }
+	cudaError_t err = cudaGetLastError();
+	if (cudaSuccess == err) {
+		return;
+	}
 
-    fprintf(stderr, "CUDA error");
-    if (file) {
-        fprintf(stderr, " (%s:%d)", file, line);
-    }
-    fprintf(stderr, ": %s: %s\n", msg, cudaGetErrorString(err));
-    exit(EXIT_FAILURE);
+	fprintf(stderr, "CUDA error");
+	if (file) {
+		fprintf(stderr, " (%s:%d)", file, line);
+	}
+	fprintf(stderr, ": %s: %s\n", msg, cudaGetErrorString(err));
+	exit(EXIT_FAILURE);
 }
 
 
 namespace StreamCompaction {
-    namespace Common {
+	namespace Common {
 
-        /**
-         * Maps an array to an array of 0s and 1s for stream compaction. Elements
-         * which map to 0 will be removed, and elements which map to 1 will be kept.
-         */
-        __global__ void kernMapToBoolean(int n, int *bools, const int *idata) {
-            // TODO
-        }
+		/**
+		* Maps an array to an array of 0s and 1s for stream compaction. Elements
+		* which map to 0 will be removed, and elements which map to 1 will be kept.
+		*/
+		__global__ void kernMapToBoolean(int n, int *bools, const int *idata) {
+			// TODO
+			int idx = (blockIdx.x * blockDim.x) + threadIdx.x;
+			if (idx >= n) return;
+			bools[idx] = idata[idx] ? 1 : 0;
+		}
 
-        /**
-         * Performs scatter on an array. That is, for each element in idata,
-         * if bools[idx] == 1, it copies idata[idx] to odata[indices[idx]].
-         */
-        __global__ void kernScatter(int n, int *odata,
-                const int *idata, const int *bools, const int *indices) {
-            // TODO
-        }
+		/**
+		* Performs scatter on an array. That is, for each element in idata,
+		* if bools[idx] == 1, it copies idata[idx] to odata[indices[idx]].
+		*/
+		__global__ void kernScatter(int n, int *odata,
+			const int *idata, const int *bools, const int *indices) {
+			// TODO
+			int idx = (blockIdx.x * blockDim.x) + threadIdx.x;
+			if (idx >= n)return;
+			if (bools[idx])
+				odata[indices[idx]] = idata[idx];
+		}
 
-    }
+	}
 }
diff --git a/stream_compaction/cpu.cu b/stream_compaction/cpu.cu
index 05ce667..4c7a86d 100644
--- a/stream_compaction/cpu.cu
+++ b/stream_compaction/cpu.cu
@@ -1,50 +1,89 @@
 #include <cstdio>
 #include "cpu.h"
-
-#include "common.h"
+#include<iostream>
+#include "common.h"
 
 namespace StreamCompaction {
-    namespace CPU {
-        using StreamCompaction::Common::PerformanceTimer;
-        PerformanceTimer& timer()
-        {
-	        static PerformanceTimer timer;
-	        return timer;
-        }
-
-        /**
-         * CPU scan (prefix sum).
-         * For performance analysis, this is supposed to be a simple for loop.
-         * (Optional) For better understanding before starting moving to GPU, you can simulate your GPU scan in this function first.
-         */
-        void scan(int n, int *odata, const int *idata) {
-	        timer().startCpuTimer();
-            // TODO
-	        timer().endCpuTimer();
-        }
-
-        /**
-         * CPU stream compaction without using the scan function.
-         *
-         * @returns the number of elements remaining after compaction.
-         */
-        int compactWithoutScan(int n, int *odata, const int *idata) {
-	        timer().startCpuTimer();
-            // TODO
-	        timer().endCpuTimer();
-            return -1;
-        }
-
-        /**
-         * CPU stream compaction using scan and scatter, like the parallel version.
-         *
-         * @returns the number of elements remaining after compaction.
-         */
-        int compactWithScan(int n, int *odata, const int *idata) {
-	        timer().startCpuTimer();
-	        // TODO
-	        timer().endCpuTimer();
-            return -1;
-        }
-    }
+	namespace CPU {
+		using StreamCompaction::Common::PerformanceTimer;
+		PerformanceTimer& timer()
+		{
+			static PerformanceTimer timer;
+			return timer;
+		}
+
+		/**
+		* CPU scan (prefix sum).
+		* For performance analysis, this is supposed to be a simple for loop.
+		* (Optional) For better understanding before starting moving to GPU, you can simulate your GPU scan in this function first.
+		*/
+		void scan(int n, int *odata, const int *idata) {
+
+			if (n <= 0) return;
+			memcpy(odata, idata, n * sizeof(int));
+			int layer = ilog2ceil(n);
+			int oLength = 1 << layer;
+
+			// Uncomment the timer here if you want to test the efficiency of scan function
+			timer().startCpuTimer();
+			for (int d = 0; d < layer; d++) {
+				for (int k = 0; k < oLength; k += (1 << (d + 1))) {
+
+					odata[k + (1 << (d + 1)) - 1] += odata[k + (1 << d) - 1];
+				}
+			}
+			odata[oLength - 1] = 0;
+			for (int d = layer - 1; d >= 0; d--) {
+				for (int k = 0; k < oLength; k += (1 << (d + 1))) {
+					int nodeIdx = k + (1 << d) - 1;
+					int temp = odata[nodeIdx];
+					odata[nodeIdx] = odata[nodeIdx + (1 << d)];
+					odata[nodeIdx + (1 << d)] += temp;
+				}
+			}
+			timer().endCpuTimer();
+		}
+
+		/**
+		* CPU stream compaction without using the scan function.
+		*
+		* @returns the number of elements remaining after compaction.
+		*/
+		int compactWithoutScan(int n, int *odata, const int *idata) {
+
+			// TODO
+			if (n <= 0) return -1;
+			int num = 0;
+			timer().startCpuTimer();
+			for (int i = 0; i < n; i++) {
+				if (idata[i])
+					odata[num++] = idata[i];
+			}
+			timer().endCpuTimer();
+			return num;
+		}
+
+		/**
+		* CPU stream compaction using scan and scatter, like the parallel version.
+		*
+		* @returns the number of elements remaining after compaction.
+		*/
+		int compactWithScan(int n, int *odata, const int *idata) {
+			if (n <= 0) return -1;
+			int num = 0;
+			// TODO
+			//timer().startCpuTimer();
+			for (int i = 0; i < n; i++) {
+				odata[i] = idata[i] ? 1 : 0;
+			}
+			scan(n, odata, odata);
+			num = odata[n - 1];
+			for (int i = 0; i < n; i++) {
+				if (idata[i])
+					odata[odata[i]] = idata[i];
+			}
+			//timer().endCpuTimer();
+			return num;
+		}
+	}
 }
diff --git a/stream_compaction/efficient.cu b/stream_compaction/efficient.cu
index 36c5ef2..aa23383 100644
--- a/stream_compaction/efficient.cu
+++ b/stream_compaction/efficient.cu
@@ -4,37 +4,139 @@
 #include "efficient.h"
 
 namespace StreamCompaction {
-    namespace Efficient {
-        using StreamCompaction::Common::PerformanceTimer;
-        PerformanceTimer& timer()
-        {
-            static PerformanceTimer timer;
-            return timer;
-        }
-
-        /**
-         * Performs prefix-sum (aka scan) on idata, storing the result into odata.
-         */
-        void scan(int n, int *odata, const int *idata) {
-            timer().startGpuTimer();
-            // TODO
-            timer().endGpuTimer();
-        }
-
-        /**
-         * Performs stream compaction on idata, storing the result into odata.
-         * All zeroes are discarded.
-         *
-         * @param n      The number of elements in idata.
-         * @param odata  The array into which to store elements.
-         * @param idata  The array of elements to compact.
-         * @returns      The number of elements remaining after compaction.
-         */
-        int compact(int n, int *odata, const int *idata) {
-            timer().startGpuTimer();
-            // TODO
-            timer().endGpuTimer();
-            return -1;
-        }
-    }
+	namespace Efficient {
+		using StreamCompaction::Common::PerformanceTimer;
+		PerformanceTimer& timer()
+		{
+			static PerformanceTimer timer;
+			return timer;
+		}
+		int threadPerBlock = 64;
+		int* dev_Data;
+		int *dev_Map;
+		int *dev_Scatter;
+		int *dev_oData;
+		int *dev_total;
+
+		__global__ void KernUpSweep(int d, int *idata, int nodeNum)
+		{
+			int idx = (blockIdx.x * blockDim.x) + threadIdx.x;
+			if (idx >= nodeNum)	return;
+			idata[(idx + 1)*(1 << (d + 1)) - 1] += idata[idx*(1 << (d + 1)) + (1 << d) - 1];
+			//idata[(idx + 1) * (1 << (d + 1)) - 1] += idata[(idx + 1) * (1 << (d + 1)) - 1 - (1 << d)];
+		}
+
+		__global__ void KernDownSweep(int d, int *idata, int nodeNum)
+		{
+			int idx = (blockIdx.x * blockDim.x) + threadIdx.x;
+			if (idx >= nodeNum)	return;
+			int nodeIdx = idx*(1 << (d + 1)) + (1 << d) - 1;
+			int temp = idata[nodeIdx];
+			idata[nodeIdx] = idata[nodeIdx + (1 << d)];
+			idata[nodeIdx + (1 << d)] += temp;
+		}
+		/**
+		* Performs prefix-sum (aka scan) on idata, storing the result into odata.
+		*/
+		void scan(int n, int *odata, const int *idata) {
+			int layer = ilog2ceil(n);
+			int oLength = 1 << layer;
+			cudaMalloc((void**)&dev_Data, oLength * sizeof(int));
+			checkCUDAError("cudaMalloc failed!");
+			cudaMemcpy(dev_Data, idata, sizeof(int) * oLength, cudaMemcpyHostToDevice);
+			checkCUDAError("cudaMemcpy to device failed!");
+
+			timer().startGpuTimer();
+			for (int d = 0; d < layer; d++)
+			{
+				int nodeNum = 1 << (layer - 1 - d);
+				int blocknum = nodeNum / threadPerBlock + 1;
+				KernUpSweep << <blocknum, threadPerBlock >> >(d, dev_Data, nodeNum);
+			}
+			cudaMemset(dev_Data + oLength - 1, 0, sizeof(int));
+			checkCUDAError("cudaMemset failed!");
+			for (int d = layer - 1; d >= 0; d--)
+			{
+				int nodeNum = 1 << (layer - 1 - d);
+				int blocknum = nodeNum / threadPerBlock + 1;
+				KernDownSweep << <blocknum, threadPerBlock >> >(d, dev_Data, nodeNum);
+			}
+			cudaMemcpy(odata, dev_Data, sizeof(int) * n, cudaMemcpyDeviceToHost);
+			checkCUDAError("cudaMemcpy to host failed!");
+			//	for (int j = 0; j < n; j++)
+			//	printf("%d ", odata[j]);
+			//printf("\n");
+			cudaFree(dev_Data);
+			timer().endGpuTimer();
+		}
+
+		/**
+		* Performs stream compaction on idata, storing the result into odata.
+		* All zeroes are discarded.
+		*
+		* @param n      The number of elements in idata.
+		* @param odata  The array into which to store elements.
+		* @param idata  The array of elements to compact.
+		* @returns      The number of elements remaining after compaction.
+		*/
+		int compact(int n, int *odata, const int *idata) {
+			if (n <= 0)	return -1;
+			int layer = ilog2ceil(n);
+			int oLength = 1 << layer;
+			cudaMalloc((void**)&dev_Data, oLength * sizeof(int));
+			cudaMalloc((void**)&dev_Scatter, oLength * sizeof(int));
+			cudaMalloc((void**)&dev_Map, oLength * sizeof(int));
+			cudaMalloc((void**)&dev_oData, n * sizeof(int));
+			checkCUDAError("cudaMalloc failed!");
+			cudaMemcpy(dev_Data, idata, oLength * sizeof(int), cudaMemcpyHostToDevice);
+			checkCUDAError("cudaMemcpy to device failed!");
+
+			timer().startGpuTimer();
+			// TODO
+			int blocknum = oLength / threadPerBlock + 1;
+			Common::kernMapToBoolean << <blocknum, threadPerBlock >> >(oLength, dev_Map, dev_Data);
+
+			// Here I reimplement the scan part, because in the main function, scan and compaction are timed seperately,
+			// and I don't want to allocate memory for data 2 times.
+			cudaMemcpy(dev_Scatter, dev_Map, oLength * sizeof(int), cudaMemcpyDeviceToDevice);
+			checkCUDAError("cudaMemcpy device to device failed!");
+
+			for (int d = 0; d < layer; d++)
+			{
+				int nodeNum = 1 << (layer - 1 - d);
+				blocknum = nodeNum / threadPerBlock + 1;
+				KernUpSweep << <blocknum, threadPerBlock >> >(d, dev_Scatter, nodeNum);
+			}
+
+			cudaMemset(dev_Scatter + oLength - 1, 0, sizeof(int));
+			checkCUDAError("cudaMemcpy to device failed!");
+			for (int d = layer - 1; d >= 0; d--)
+			{
+				int nodeNum = 1 << (layer - 1 - d);
+				blocknum = nodeNum / threadPerBlock + 1;
+				KernDownSweep << <blocknum, threadPerBlock >> >(d, dev_Scatter, nodeNum);
+			}
+
+			blocknum = n / threadPerBlock + 1;
+			Common::kernScatter << < blocknum, threadPerBlock >> > (n, dev_oData, dev_Data, dev_Map, dev_Scatter);
+			cudaMemcpy(odata, dev_oData, sizeof(int) * n, cudaMemcpyDeviceToHost);
+			checkCUDAError("cudaMemcpy to host failed!");
+
+			timer().endGpuTimer();
+
+			int count, end;
+			cudaMemcpy(&count, dev_Scatter + n - 1, sizeof(int), cudaMemcpyDeviceToHost);
+			cudaMemcpy(&end, dev_Map + n - 1, sizeof(int), cudaMemcpyDeviceToHost);
+			checkCUDAError("cudaMemcpy device to device failed!");
+			cudaFree(dev_Data);
+			cudaFree(dev_Scatter);
+			cudaFree(dev_Map);
+			cudaFree(dev_oData);
+
+			return end ? count + 1 : count;
+		}
+
+
+
+	}
 }
diff --git a/stream_compaction/naive.cu b/stream_compaction/naive.cu
index 9218f8e..169230a 100644
--- a/stream_compaction/naive.cu
+++ b/stream_compaction/naive.cu
@@ -4,22 +4,95 @@
 #include "naive.h"
 
 namespace StreamCompaction {
-    namespace Naive {
-        using StreamCompaction::Common::PerformanceTimer;
-        PerformanceTimer& timer()
-        {
-            static PerformanceTimer timer;
-            return timer;
-        }
-        // TODO: __global__
-
-        /**
-         * Performs prefix-sum (aka scan) on idata, storing the result into odata.
-         */
-        void scan(int n, int *odata, const int *idata) {
-            timer().startGpuTimer();
-            // TODO
-            timer().endGpuTimer();
-        }
-    }
+	namespace Naive {
+		using StreamCompaction::Common::PerformanceTimer;
+		PerformanceTimer& timer()
+		{
+			static PerformanceTimer timer;
+			return timer;
+		}
+		int threadPerBlock = 512;
+		int *dev_0, *dev_1;
+		// TODO: 
+		__global__ void NaiveScan(int d, int *idata, int *odata, int oLength) {
+			int idx = (blockDim.x*blockIdx.x) + threadIdx.x;
+			if (idx >= oLength) return;
+			int flag = 1 << d;
+			odata[idx] = idx >= flag ? idata[idx] + idata[idx - flag] : idata[idx];
+		}
+		//int threadPerBlock = 1024;
+		//int BlockNum;
+
+		//int *dev_Data[2];
+
+		//__global__ void CudaScan(int d, int *in, int *out, int n)
+		//{
+		//	int thid = (blockIdx.x * blockDim.x) + threadIdx.x;
+		//	if (thid >= n)
+		//		return;
+		//	int m = 1 << (d - 1);
+
+		//	if (thid >= m)
+		//		out[thid] = in[thid] + in[thid - m];
+		//	else
+		//		out[thid] = in[thid];
+
+		//}
+
+		/**
+		* Performs prefix-sum (aka scan) on idata, storing the result into odata.
+		*/
+		void scan(int n, int *odata, const int *idata) {
+			int layer = ilog2ceil(n);
+			int oLength = 1 << layer;
+			cudaMalloc((void**)&dev_0, oLength * sizeof(int));
+			cudaMalloc((void**)&dev_1, oLength * sizeof(int));
+			checkCUDAError("cudaMalloc failed!");
+			cudaMemcpy(dev_0, idata, oLength*sizeof(int), cudaMemcpyHostToDevice);
+			checkCUDAError("cudaMemcpy to device failed!");
+			int blocknum = oLength / threadPerBlock + 1;
+
+
+
+			/*int nCeilLog = ilog2ceil(n);
+			int nLength = 1 << nCeilLog;
+
+			cudaMalloc((void**)&dev_Data[0], nLength * sizeof(int));
+			cudaMalloc((void**)&dev_Data[1], nLength * sizeof(int));
+			checkCUDAError("cudaMalloc failed!");
+
+			cudaMemcpy(dev_Data[0], idata, sizeof(int) * nLength, cudaMemcpyHostToDevice);
+			checkCUDAError("cudaMemcpy to device failed!");
+			int nOutputIndex = 0;*/
+			timer().startGpuTimer();
+			for (int d = 0; d < layer; d++) {
+				NaiveScan << <blocknum, threadPerBlock >> >(d, dev_0, dev_1, oLength);
+				std::swap(dev_0, dev_1);
+			}
+			/*for (int i = 1; i <= nCeilLog; i++)
+			{
+			nOutputIndex ^= 1;
+			BlockNum = nLength / threadPerBlock + 1;
+			CudaScan << <BlockNum, threadPerBlock >> >(i, dev_Data[nOutputIndex ^ 1], dev_Data[nOutputIndex], nLength);
+			}*/
+
+			timer().endGpuTimer();
+			odata[0] = 0;
+			cudaMemcpy(odata + 1, dev_0, (n - 1)*sizeof(int), cudaMemcpyDeviceToHost);
+			checkCUDAError("cudaMemcpy to host failed!");
+
+			cudaFree(dev_0);
+			cudaFree(dev_1);
+
+
+			/*odata[0] = 0;
+			cudaMemcpy(odata + 1, dev_Data[nOutputIndex], sizeof(int) * (n - 1), cudaMemcpyDeviceToHost);
+			checkCUDAError("cudaMemcpy to host failed!");
+
+			cudaFree(dev_Data[0]);
+			cudaFree(dev_Data[1]);*/
+
+
+		}
+	}
 }
diff --git a/stream_compaction/thrust.cu b/stream_compaction/thrust.cu
index 36b732d..707b515 100644
--- a/stream_compaction/thrust.cu
+++ b/stream_compaction/thrust.cu
@@ -7,22 +7,26 @@
 #include "thrust.h"
 
 namespace StreamCompaction {
-    namespace Thrust {
-        using StreamCompaction::Common::PerformanceTimer;
-        PerformanceTimer& timer()
-        {
-            static PerformanceTimer timer;
-            return timer;
-        }
-        /**
-         * Performs prefix-sum (aka scan) on idata, storing the result into odata.
-         */
-        void scan(int n, int *odata, const int *idata) {
-            timer().startGpuTimer();
-            // TODO use `thrust::exclusive_scan`
-            // example: for device_vectors dv_in and dv_out:
-            // thrust::exclusive_scan(dv_in.begin(), dv_in.end(), dv_out.begin());
-            timer().endGpuTimer();
-        }
-    }
+	namespace Thrust {
+		using StreamCompaction::Common::PerformanceTimer;
+		PerformanceTimer& timer()
+		{
+			static PerformanceTimer timer;
+			return timer;
+		}
+		/**
+		* Performs prefix-sum (aka scan) on idata, storing the result into odata.
+		*/
+		void scan(int n, int *odata, const int *idata) {
+			thrust::device_vector<int> dev_in(idata, idata + n);
+			thrust::device_vector<int> dev_out(odata, odata + n);
+			timer().startGpuTimer();
+			thrust::exclusive_scan(dev_in.begin(), dev_in.end(), dev_out.begin());
+			// TODO use `thrust::exclusive_scan`
+			// example: for device_vectors dv_in and dv_out:
+			// thrust::exclusive_scan(dv_in.begin(), dv_in.end(), dv_out.begin());
+			timer().endGpuTimer();
+			thrust::copy(dev_out.begin(), dev_out.end(), odata);
+		}
+	}
 }

From f24030528bcee0eb6f80639a001e11ba94c7e037 Mon Sep 17 00:00:00 2001
From: guoyi1 <guoyiybb@hotmail.com>
Date: Tue, 19 Sep 2017 23:31:22 -0400
Subject: [PATCH 2/8] Readme Updated

---
 README.md                      | 101 ++++++++++++++++++++++++++++++++-
 img/ScanComparison.png         | Bin 0 -> 17585 bytes
 img/blocksizeComparison.png    | Bin 0 -> 8994 bytes
 src/main.cpp                   |   2 +-
 stream_compaction/cpu.cu       |   8 +--
 stream_compaction/efficient.cu |  17 +++---
 stream_compaction/naive.cu     |  48 +---------------
 7 files changed, 113 insertions(+), 63 deletions(-)
 create mode 100644 img/ScanComparison.png
 create mode 100644 img/blocksizeComparison.png

diff --git a/README.md b/README.md
index 1d179f6..8da03f5 100644
--- a/README.md
+++ b/README.md
@@ -6,11 +6,108 @@ CUDA Stream Compaction
 * (TODO) Yi Guo
 * Tested on:  Windows 8.1, Intel(R) Core(TM)i5-4200M CPU @ 2.50GHz 8GB, NVIDIA GeForce 840M (Personal Notebook)
 
+##Description.
+In this project, I implemented the parallel computing algorithm of streaming compaction. For more details, see `INSTRUCTION.md`.
+
 ## ScreenShot
 These are the test results of all the method I implemented.
-![](./img/result1.jpg);
+![](./img/result1.png);
+
+![](./img/result2.png);
+
+##Performance Analysis
+* *Block Size*
+I compare the time cost of scan function under different block size value. The result is shown as the graph below.
+
+![](./img/blocksizeComparison.png);
+
+It seems that there is no great difference when the block size value is changed. But there is one thing we need to do. That is when we sweep up or sweep down the array, we should change the value of block size for each loop. Since we don't need to deal with all the elements in the array in each loop, we should adjust the block size for each loop to avoid the waste of computation resource.So it should be something like:
+
+	for (int d = 0; d < layer; d++)
+	{
+		int nodeNum = 1 << (layer - 1 - d);
+		blocknum = nodeNum / threadPerBlock + 1;
+		KernUpSweep << <blocknum, threadPerBlock >> >(d, dev_Scatter, nodeNum);
+	}
+
+instead of: 
+
+	blocknum = oLength / threadPerBlock + 1;
+	for (int d = 0; d < layer; d++)
+	{
+		int nodeNum = 1 << (layer - 1 - d);		
+		KernUpSweep << <blocknum, threadPerBlock >> >(d, dev_Scatter, nodeNum);
+	}
+
+* *Efficiency of different scan method*
+I compare the efficiency of different scan method and make a plot below.
+![](./img/ScanComparison.png);
+
+As the plot shows, when the size of array is not very huge,  `cpu scan` will be a little faster than all the other methods run on GPU. But when the size of array is very huge, `efficient scan` on GPU will be much faster than `cpu scan`. From algorithm perspective, GPU scan should always be much faster than cpu scan. The time complexity of `cpu scan` should be O(n) or more, but on GPU it can be reduced to O(logn). But from architecture perspective, GPU will produce greater latency when we access the data in the global memory(I save the data in the global memory in this project. It can be optimized by using sharing memory). When we want to deal with a huge amount of data using GPU, the massive parallel computing will "hide" the feedback of data access latency. But when we only want to deal with a limited amount of data, GPU has no obvious advantage ,or even less efficient, compared to CPU. 
+
+But there is an another thing I don't quite understand. That is the `naive scan` takes the most time when the size of array is very huge. I think `naive scan` should be more efficient than cpu scan, but I don't know what's going on here.
+
+* *Thrust scan*
+As the plot above shows, `thrust::scan` is more efficient than the scan methods we implemented on GPU. I think there may be 2 reasons. One is that `thrust::scan` function may use the share memory to store the data and access the data from share memory instead of from global memory. In this way, it will produce less latency because it visits the global memory less times. The other is that `thrust::scan` may make some optimizations on the binary search algorithm. The best proof of this is that the time cost of `thrust::scan` will be much less when the size of the array is not the power of 2, which means when the size value is the power of 2, it is probably the worst case for its algorithm.
+
+* *Test Result*
+
+	****************
+	** SCAN TESTS **
+	****************
+	    [  34  28  17   4   6  42  43  24  15  44  27  19  13 ...  43   0 ]
+	==== cpu scan, power-of-two ====
+	   elapsed time: 0ms    (std::chrono Measured)
+	    [   0  34  62  79  83  89 131 174 198 213 257 284 303 ... 24338 24381 ]
+	==== cpu scan, non-power-of-two ====
+	   elapsed time: 0ms    (std::chrono Measured)
+	    [   0  34  62  79  83  89 131 174 198 213 257 284 303 ... 24197 24245 ]
+	    passed
+	==== naive scan, power-of-two ====
+	   elapsed time: 0.057184ms    (CUDA Measured)
+	    passed
+	==== naive scan, non-power-of-two ====
+	   elapsed time: 0.057216ms    (CUDA Measured)
+	    passed
+	==== work-efficient scan, power-of-two ====
+	   elapsed time: 0.157728ms    (CUDA Measured)
+	    passed
+	==== work-efficient scan, non-power-of-two ====
+	   elapsed time: 0.153376ms    (CUDA Measured)
+	    passed
+	==== thrust scan, power-of-two ====
+	   elapsed time: 0.156192ms    (CUDA Measured)
+	    passed
+	==== thrust scan, non-power-of-two ====
+	   elapsed time: 0.023776ms    (CUDA Measured)
+	    passed
+
+	*****************************
+	** STREAM COMPACTION TESTS **
+	*****************************
+	    [   2   0   1   2   2   0   1   2   1   0   3   1   1 ...   3   0 ]
+	==== cpu compact without scan, power-of-two ====
+	   elapsed time: 0.003695ms    (std::chrono Measured)
+	    [   2   1   2   2   1   2   1   3   1   1   1   2   1 ...   1   3 ]
+	    passed
+	==== cpu compact without scan, non-power-of-two ====
+	   elapsed time: 0.004105ms    (std::chrono Measured)
+	    [   2   1   2   2   1   2   1   3   1   1   1   2   1 ...   2   2 ]
+	    passed
+	==== cpu compact with scan ====
+	   elapsed time: 0.009853ms    (std::chrono Measured)
+	    [   2   1   2   2   1   2   1   3   1   1   1   2   1 ...   1   3 ]
+	    passed
+	==== work-efficient compact, power-of-two ====
+	   elapsed time: 0.212384ms    (CUDA Measured)
+	    passed
+	==== work-efficient compact, non-power-of-two ====
+	   elapsed time: 0.219104ms    (CUDA Measured)
+	    passed
+
+
+
 
-![](./img/result2.jpg);
 
 
 
diff --git a/img/ScanComparison.png b/img/ScanComparison.png
new file mode 100644
index 0000000000000000000000000000000000000000..7f48b46746c4a515a661617f46f8ea03437f2fd3
GIT binary patch
literal 17585
zcmb`vby$^O*DkuS2_>ZkX^~izAdPe*A>ECnbc0HF2`u=rkW{2Q79~h`H%NDP@40y2
z_dDPDXYcDfXaAvIES@!E%rWk9k9*9=;P>(pPtl0cAP~q?DM?W!2;^QD1cDOw<R17W
zW6re&{Db14Bq0nb=p|hTKRhsdC-)8lDUL+HGI$7nMzxdFaDYIbH6#C^wAubNhCoEc
zr9|JUxaw}tpgWR|d9Awj6treol@*(f!WOsOIeTSGJ~_uMz8d(`F)p$1%2C`}SZ)+9
zLFmCT+A83zPq&zc*H%I?<lgW8Fxw>GoF7$&O-PtpGzjZA!4vEUQvK8@A>W09UY-R!
z!TR$Rf^tuvtLAj>Oix!^g{%MR_g@#EcUOlga&2Y`)YRrKH$OU#Ieh{PZO}QzhjjOH
zJb%W1A7V;p{cwy0(k-17tj=gkTQE=oJ`-tzM2V}ZsV(%h%X)cvnQ}rh2WMuOtRJG@
zhd|CE{ZJr~D~TpB)D4vZ`1>}R1p@KCl_Z2f8hxlSAdtU;IFBHZJ@Ws<<LZMvJUlx!
zn+56V>G@ifN$Jzds;b!}8rs^^gM)_BW@<V*OyB%f<*Osvm}O#xVKm3(cJ&Ox=0|QC
z<sZMnPQLy_SR$*asAv!Z(Tip&!W!h1GWwwtr(R(NbCj>Et21@JF}JcB)`{BY660=d
zeMm!MW!f!&(vtsAZDfU|qGrACa|(`&%(%F?L<_;Cn~q3NiKfO{spibxpL_?!DV^7r
zgjrcx?yfYA^z25?aKGr<NKRSvV3jBzf}(Wava+(Zc*dT%42AgBk<7<_exI*|n;Ngi
zccjNda|dboj`~H)l;1_ki$zwzdVT2(sAV(^P#DmHw$I~DoBF-z48B96SXcy4Qg%pF
zXF8|!EK1{<w6foXhK8C9dMV@)iP;CoZAvg56xOH8Gb_gEXTDc`-ILC&flo=Y$gFBA
z75r3ako1T4mptK(ClipgZ`N}314+WFOUwoamnOHJ6f{y+B|VxN?M>ER2<v!8Ju|ne
zDMlGBV7UlO%<Tz@8OgDW<ISG&H_l=;ZWmbRV-Ahw+L(y2c3pEf+Q_8sR}(LaGeynZ
z#sldJg-?bb(Gm?TzGUMQ$?S(4Ib5xO9ggEUc-6O`z$C@Y8VRFJHdyUsZjUgpX6~mU
z`CjU%#Hs#F<=~xi3BJZK>FSTLshI?^iIIt?b_`V{j~Fpf?;mF5M_Ql7NKu(gy-mPN
zA|6YUv3{k~fjNwRCd?bQgf^&T`EV-IU9wuWpQei8TY&Cb6=(L&b7C3t`owE{1Z#qo
z*1?9~$;S?lxPzh})21{YbkF%N6Sdtc{G#m-S7!C-wHq_y$Y`dHHBacBC-6)rcHUp;
zC_9GFykO^#joZ8*+lTc=t3B#Xr?y6wnU4u79A~|v$4JQ<-v1#}j<91Z=Uc})tmI2k
zAanH>xNu_=I4#UUm<58$x|m)%y{DkxRA%nEMX*;_R;=)5)zjP`e=58tFVHO>n6OWu
zs3->=;SQE`y*7@Qb+7p_&-`v<ErV}l%e{Ooy1JzM&sTynJ?DA)OGyJRsi{vB)P3^R
zPL6CaGxq7PIibf}8AX@r&s7dW%0wf4`H3|t+<eL(k68C!DVDyV(OR&92RhGRV7W18
z23GWi_6{D3N*mW*P@8%Ov>P5{L|?F3AlxuL2u*ZK?A(Gz6*ST@i<9X#2YZUpi~FkN
zC-apwUzPElf1g-3f2dKl`X|cANhy_4<BLsje_;Eg&CGv<+32UJNVwaSA(>)LjeO(I
za!F*$aiW)!)<fSooG)HY5pQH7u$ZFTlGZJ0PPQ|wugi7tD_VvhvBG*sPE^Ke#<R6u
zYlslCurdZE^eL#9N@uePxlQH!b}c2QGF}rdExK3>@)a_k%Nt$9<30g2q5+)B+r7MY
z8@N|oKM(v`&P{eupp%~#o?*;2KEsEJ7=!biKzf~L+Oyt(V@tt1kxW{L#b9PI6<b!)
zxbsZ(IB;pnY_S)_?x5glzHNIq)WO}WK=Rg6#&3pDC!v<vQE3BFh^_xyk}&b{C3Bng
zI-inif5j9&?U<BSx(pT%y_KNxlp%d|>p(rbvIFBgSA5Fw!ir((cv?i>oAN(1!f9P)
z{vA$y&$T<I3i<qN9;C%~I2It#-16{0a>dtDDm+})i1t!pLooMcs*h(lj#T_%{sR`C
z{LtSq*I_q_#{ZB<WNWbdNVa2BTFa0wwu8|t$V|y%p7b$O^%uL%wW@v%VNNNTtr{yd
z>;vI;>MRt8mj?RYWyi4Xn&N&mhcZXXYWYbVoiF`T^A_aWBy5q~@h@XYG*F4y3T&hO
zw{q%JhooH4{h5crp7vGjXbLsm(40_(>0;NlU7jDPGY#u9xrxEiI!h@pe;QxF)z>l+
z8~*&#YSuDa!qYu6v<@aPP35)af;dDrzFok077W;T>|4bjdD`UNHyC~IWC~tR^YAb`
z#z)Bw;<)JG%uGkgwKp0fA*@0!A-)~2#~7-YY_a+=zm7CN*2Xfi;!j2732~tpL9SLh
z39V)7_OGuxU*vzqh3CcK&!v<XT@QY%p^2}1Wi5z`Q$bJ`$hB;Wh~er^P>|YMp&=)d
zVW{$`ERtCNWgR@D?{a8LWm(3bE<0IDS#7D^NMwi^2ZPg}vt%<BCv&wGSUl`Q8E)c!
zra5`YzWsxmd4jKQaIpY85sLF@MIwpJ`dcPSN!@pji9v4*UK0{FF9q5j7*lcnFZr5q
zwMiV{eHJ1nu)#v}*w@C>s!_t$Le>J3x?kj9BY11}4+@V&YJ@JMqjuVxPGr<J;;S49
zmLxZDtjy?XDo7-&CzugL7mnjE2x`>-<;jR;N;d$h2Zi~xUNI`Av6^$GF6gdt1(WfT
za`_n~R`)-5@n3WBNCt;>u@1L&Mh~wljxv)_QPtoR^<7~UKkk(6i}NHLiXZQZby{EP
zXl;*J!+)*yuGI`(M7VM^K9gV2x+>Zp7AMSYsF~iTA-(k7!o;mgAkyB-1V^0^?6_yU
zS$k4mYRXuPIibQ*T4s8M%{sW^N5|Gf$ds=;HS`_bx3V9aKS^va@5`LDoIF4uhw9{L
zEtFWE7J2<ZZYbH0F`Qo510C!Kk*xWSrm(%f?YJm%P^xd1>91nV$I3ta!|-JW_CABY
z2Og+xG|T93MYcY(4YAXZx5`Q@*}(g&h405^`Sa|Mq0MM&#hhG~rTvb%(4-`xe{PIk
zK26h?EkLRc!Fhx)OiX3**gBL}Cy7I8&~IIvDB8J)(~NCwo6TRKe>)i%VN`D}rZea&
zmnnlLmPdw+0dqKex*l~XK<o8dX30#cO&Vgk1j{Yx@{v2rWfnvERFrHy)ZzHE=8&_P
zbi&^WD@?bbY_yqA6Y@IWZEDTP{d<Cl;VPZa-Qea#E{K1Yu0I@l#T97YyctrSvT}%7
z)le-F@{nFzH#3!ueo=;*&@w5)GsiB98K=Ve@9p{VVLLB6$?*Mv*#sA%P{w|ZKe>vt
zE|Q7I=07#o=2T*6-!E>HQ<bZ2q>N^XBDV^)%0_`yhXZ;b)CBPb96`wYr2$09o5J9w
z;M(KXu79A5C=h$1{{vV0A5yFRg$2VpCRZb)jQDX9e?a9dQ6Z4Tge*7<wTO9Gln>3v
zwIFH?qV=`4sHo_l4<L}0U`xV)B~&>=94LpwT2);U;CO5jO)Q<AozgNgCV%9fD;W*}
zQrAw3O7;6%$PaM9#)W7W9BN(3_Wu2cp3;M3V=fpFUtzlIl=X8qp(e>c=v?A)-@Zu|
zMPc6z;zE2MYHgrql$EI%`ei9nonPicAo{vh0soh%<p0(@lCNIBe$B-626x}})2HG%
zS2Pre&`P{}(;C=4wW5xWb+f332JA(GhSIw><gcm%qW{ujxM<@9L_i=>yOUE>S&^|m
zJ&ui%gs3*ZuxMy#g8L+^d{H2;@D>*rpFe-Tyu3WP3`_R~_TWPmDe;fPBOs6&W)XAP
z*xclO1QB{>X>K0nN}=nq{YII?XK)S%hu)_Sd%$JT9@OI!!y??}jw~mJvgMLkczAi`
z6z?W#ic(Poba=6)r6oK(oaY%t2wvm5pWYe@jzp5$Q2KtwFmAwuC)cs)Bdjg5d)6Ny
zLhr^Kd>UxOva@NG@%Rb=HGkipK45NQl0_RfJFBZq%!j1q{#$>7afzWHKYo-|e1+uf
zcqKJ8JaUBA*4Ejt@R0N!ZFFz1s5LYsB&4{QRhbwK`K^bW{b?deEY3UA79mZ-fct-E
zX)!E*O2TR0^wwqPANr^0z=3_6hDS!S_S1j;k{%5BuaCyZf1+k&Wwqe>2LZ1ULMf@_
z!4(k^$>tEfo9w-Z2ck9fj{n;s3yD`k^K%>BUy+Zdt?%xRxfVNbPxjk5t-M3d+Hbt9
zYDRYVMQILVol2V&+AuhrOqrPHZk5Z!Im*OPPMc}-kdn{HA>MV2=J)d5Z8IV|8atc-
z99Kq0Mm7ftI7~4yF+lK54L2nEGeu#P5Xiyr`R2ek27W%d?2#Z=KzTwfuA-(k<(Ect
zP$+*75(S;sN=e~%XpJ*P9b>_n_EY2(11{4}wc3{o7V3R{v1f~1sH7ckK$xr-U(9<Y
zrF4G?WT}2@7P+VBzfy#3ImjbDuv$MOy|}oDK!HSk0H(Jb%^UFBUrDx2Qqq(1F>|lS
zh+@Gpy^Q-KM*_ZHl6Pkkq+1eIl1Jd})1^Xu`4qLZa#5)y+zY@`r=i(sUaHgvYt#h5
zhHexDz+k`MfWthP{e1s1hr!lFX&asi3G$Gx;;AZm4gm&1qUPjN1@iYPe+W#|-Tmmi
zHJ*mL*d9%l{pxWP7^mH++98)66KPtvyz=r7xZ+-3b@ZK2k@i1O-<kgRIn~?SI^l<l
z%URgmjauluJDZQ1QC&TOw~TT3T?<c7&+W<bB$h{yAIn+v-aVBN@q#yd-|%pyC;L^x
z-DEP=&i|h5+)Q6zXt8Co+>(x#R@Q=<0=YUL`@Mf3{edhv`UdYh+OVA+8|5S;<nb=S
zrfWxFkC7YXQ`XZfM9nBKAHiED!x0w-C8C8z4lI!}=RKMOH_1IneD=VAVmJZi4`8I?
zVO((ui9lLZg{D``%<(v2y)Va>wt&+hVL*z|#Kc4s>F-O#>&YAj{|I<Z;w@9-h<`~&
zdPfK-){s!x{$^%oh8X&<1tJ3*)RY{YoSl*@s2PQYyI^_0r)u3wX~VXsDwET({_B8&
z192z=?1{e*iPFKv#XV6qyMO<FHisHOl4(DKeR@>L%O9j&+gd4ZjK_Wh<KyPcs<NMK
z$v}Y)S;D)-4i<f?9M_CQQ6aMSYw*;a9q;$_^ng&^owW|JzdLd51cLvZ_-5}v+!_0Z
z%>hrdU#%j;t=*}9dc*4KZ|>KuRN^Tuo9z4IVDOhe!XqM7RaDHI2#JVTvkvjL1*aOW
zR&FkBVxkN}?)~eL7u@!ui!I<7We2XpYiqO@{4tsZZv*Jj2$84ok80hTR*KxS<F$tv
zL<Mj@ed&LV>~ef`WL~RYX*2W1)`?T|vZ~s*_`)*#l`GPz?8o5z9vlXwZ;Ki&F=G=h
zAMM=QwG*&BKn_T{JiC$C&@dO*tE|eb{{-n++`lq1L>9%Yt@G)Veh?9`@SMU1-{09l
zF|=U>R_FU^J%?9TQT@(A(trPc7fxU~R`7zHoGa@Pn}meSb&o2Eg*IX|d9dj2TVmi_
z6W=a=lsch^+<m}ZtlmAlv2}HRnC&QlL%^as9g~kv_{A^!y^4y8rshZ51!ShB#|8+U
z{RHBR#dM=;Hc{tG@!zuxfCBUv(Ld7w4)|HD_NFAUJR=vd3Ry8~eHg~Y1sk;c^pxsd
zlb^>^5vem|WHeQtX{Cg3Yg#kw=UrKO+JA0%P$Nkl<`;*Wk(b9<jRo=jUS3{qQTsDD
zmtE`-J5&}!z&)2XY(IWX)?y8yS_i6#AU`WEn9Y2#H9Uz$K842w%w}clHVOr16Bo8`
z0?CM?SvGU%E@wjoN%>sgFNy(A2T)AkGd)nrTyU018#YwlmnfVn`5!dmL;Y$S4S|$o
z<>W}=w%%M{$_;pqqZ0zZ>0Ee-0pcit8npvg6$F#$Q+8JWpD2(ga@05)-TA%K4UJJh
z4Wvu`ERlhV=9ZDWZ#b0g@7dxA{BGr5YeuE?BukbCGR$78S<Tb{oI$RnbK3Z5u(NNa
z{UHVt`(M&A9;livG8HcO{^tXr!I(Fxx2Hl@#{d1%CB9oOy9bJqehX7^u%dF(2c%b(
z>`qrZfV5yW{?ej3&U9-KH+9VKQ`U`za-8+u?`>Htd6M613VNX!S&hfhdaRo5>)kkC
zZ7rIz>EAtIWn~5Yz{=J2B#0$cMqwuU=3eW2WzSWoV1qsnIVq5^ArRvULmQ{~frnx0
z)ZTwj<(kY9GkA}}kVz<hWOx|l$xjP@^qu2J55sDH$SRhwV<x)}xEgs{QMf2;0WJ)I
zObky=<?g4Kl&}$}%%zBCL-nU`=R3Mer{iTQTM9^Io1Sb&{wox$G=WtE;0-dkt>)WX
z18K*cxX@=e1`CTZ|MKG`NopkxjU3d)g_h844t6yKGD#nl440H(f~RA2H{<MgnYSdn
zv{ZSq<(`cbXYGZh1+%{BqeZ!0F4V=dN?C)ukTDLg8<`l$kdRX}WvlU}$Pr%jU&4?g
znWsd;@e7c{iJ^d5t$5s7Jo5rYd5Lv6?#x&eSA3U8nK1nydBTyA5kQwr4c{TbG9+Y4
zkNqh`s8@Y2zn9WX>y7Raw1IolXEd(HF#6A&)5qGk2NueN1#Z+B>swisCrCWjU{eAl
zXvCA+GA_!17XO!H2rSXxszIx5XMJG|a3bkq^*lf~aDiNzK;P579AX0eDYr{5x^1FO
zu6Eo>#9YvKzBtN~aFED@nMu-Y%cH5k3)9pPo0`TPLt1K#(#fi+h(P{o66lyQOlPWQ
z13Q&N+Ko|?1FjiTgl1%%{%MDF1`pm*hU!^He`h&;_zJK#>Fq3ZBE5FG3lxatkF>OR
zxUFd-fwGFGgL;i%2jD2Kyc5B+^LHs_6wFO->B4-AR_FTio73RQv~X+r`>N%5zRr^i
z;a?LiArTSJG%_L(BgWyHYr2(1$y_7~O+`7vXv#Jq_lFk$1t_Z5ShbryOu)iy!?G_N
zVCMsAri$`2@Nn7QDvuqNO!IMEkJt>vu28PzD}Gu0-4b)4Jsl=QUXUAg0e`9tFN%>R
zlLryxx3V^nK@6?1o-z$#GlJ^32hrP$K^1Nx;%!{A2JsJKSU4U($)R`DZfD%CU7ojb
zmxMu#VK%!qMt)J)B!+%ENmmRbW&O(&Va9Mj12yW!jsZFiJ-s<rP%D_;wmS5|`Lkc$
zZ^PsSut0ZW{U$5o^Zi@7MKR+skH|`LmaLoTo8BW&qIUVFs0+3o``ny|)EH?L&H0Rc
z$<eZ}r_f3s%<$InAPLjiGVomBT?`CV(Qa2Mf7)}qR%?7&J@qdhvoPne`cK5-j<G0}
zbg9^wCsG-_n!(UXh(g;jtt!jT(qcv*lR|)!=BmVYPC$;3%`k)w>n?qn$`OLomCJb^
z`X||zb3gr<Q#tX&gcPBYMr*kpCtUsIF}nhx`}uF10J=Qj;7sWCBN|EQgsZAauF-Ym
zjeB6-Sj233OSun~eurZ#(OEY|Ve2FneS2d~4JC*8?xno_B)ljlCl^lN>Fa?)WzVxd
zmA|-}?E_gn`kKu$g&)JxG>^)FPOB&qZ$t|+?=S1A3X7)1vHV_f&VqhdRuF~R?Z>05
zvbE#4zZq{J0TMg37>ay{k^BU$4lf=;e62o#jLFGqDm?_No#wK;1yog=->orDa|csj
zyE6^_ggb?WFExNM3`!sjfvDGt1U|E9GB-D85hEhZ_wpP?CmiV7_abN6Ul>=DGq7o2
zM}pID_3`}PLG8x3pCW?^JZ4EEF_N05L8%IPi4pUfLszo5{YusB<X&t4p$m+1^B`@V
zym8HK0&nGx*%|ySEFANTJ_i_&PKYb9DVGx>w!q}`aiL{iOU~eqw_#PSteA!q7@C{6
z$7MTY?a+r4B*1H$@icT4l3a^71J1rJX0zN8z$ft}(4-``x;YCgD^~#EIZ*wu)X-h;
zNGU?@!~2AHtpDEd=%{Ivn46oCk<p6JX8_{s8c_YR8JmTc8_ZTZ_Ulp0b|e@-$f~QG
z@e6fp4XtL@KN?ANrD*<3lFf38%<514NRTlQ?^cU71X8;9C|*uSG1!*tB||m~9g-C7
zrPAqkZ!&KexBJ!kvd$hP(SM+8uv}<?pSBkEF1A|CQvn40TiWsmowcIU^Wt8s@o-#7
zG}Vxx??4LT6k~U1$9prs61k4EoYK-EztD#*q3Xtldjnd^dW}VbzWXa}vQqLft`xU1
z$k}>e>}CK+@kyb7@(5UF&tbs?2%DhDisYt$M4J*nNJ&Wz;1RKkK_Hont)Y{XlMnxd
z0<!b0{-bn@=;;xr{y&;FXb#U&smeDtK9Vp3Qc6PNuqIyxIM{M)Xi`#Aw{7oE2>}bW
znIuTF3u`ZEb*~O89ZnvzFye@R#G#+|`<*g}0<k#9fiA=j{2o-WXaeaPP3+bb7ivs6
z4#p-#HBtqY(gi&#vbwN1$AvEJ1HPf8-3Xv4<GL%GrBbRXsKt;v3=hoS1vCR`Y2!b5
zJvm77`@a8X_kH3w6t}GEYPX)GH^k6izkY#TbceZZxFW6>jBXWiTPMc64W%PrY}zu9
zy0TVpj`2(ZD#v(-7Y-X68!=Jun)YI>C>(3c%7!EE%fNymDC`XP4<u}DZ9#q88rq^=
zhlTW)3V>#<=c}>?@RtUzQopcxbd{8pbae6;8<p@K?>%up7s8r$Rs8Vb+d2P)a$=aS
z=DCI(p_(&~)Iz_6Ty0der%03JyW1xspq>_bm;(8tEAW?Ba8Zm;V4y~9v86FY%h0Gf
z`{>GnR+mFNby3ha8VB{hko!A2-|q>SXI*oy6wLfifz`f>w`KG-?gQs2VYQwJ8PHDC
z?MHpNwtQb8hHu`sHu0@y>cTzo%LKXF_CWGR$zVT}mv!H9h5EZ5Us1XVEBQz63ujjO
zvKGz!K_|N4N^SzH`mZ7C?T}P$xv|j~R{R9`FWFU4wJ$4oe3ebwJ~&(D@`L}jBt|%$
z?$OCf5>Y6C`>;^~n-KYLiLS+${J~SvOH4SAe2>^<A!9l&Gl;os8+KMPX+Kz^PC(b=
z5}NO>pUNFlt9?J+2GT(lt`kShJr+iDl7M$ksN{Q!f%VLiq6$&^w+6|&9t6H=JNTSO
zLPUg0sT(vuqIam<=z3^Gt6O%JL*JnV7}R=CG(?i{l@*BEH*em&`xBZ=hv^E{cT9k}
z4%m5lF14%V^MRrwN;d%YCAWxq5esf<m)*HgJ2)#v#d)JztXXtIHE8Q;?HF}f>|DyP
zm^lz!gUPn{`q4>DDeoWZ2w>e)sD10O5(b-p?17TubKVpCb(cD1_9i5l;8Gy!2S~?&
zLq_RNKKMTNdd2itc8oI^{vN=kvn<<>O@wYvZieoAPl3a?PXVY0JX{iLeUF90P(J(P
zYl{R-Kl(LS>}~HU-NvAkR5|V9@!NN}&`BGvZwH{uDdcW}>q{rn%@1STKKR@(N*N90
zj7J2}KY)&~Gb6)up=IavPg|ed2l@v{Yh=km;25l@#wBH4kDDm=4W}xsKewXqJ`7`M
z`vC%KQ%X7KB|xf7E{S`8r+&R6w5i2vi+I7#?r8$m*Vetg{&NK2wbuN6$d!@pLzd9L
zAAM=?oyB!Q3{Yp-eC|3r;pq(Z;yxTWnR%6f_jy!~3R3PFOjf&BwOuha`(}BO{I-f-
z+Dy0Wu_u9iEmp#q&zyGSPj&oA40#Yl!5*^V_k^1y(|}yEMoh$&)rb@CcJCDvQypm8
z)*t8F@?Y&Wvz2@tdChJl4}+5L=`i9?6&nSj61-~-HNTy>S>{pzeCXr@F7(9fC0U)-
z>*rWF;%GRG#3Up=4}39jgluhhV-*C>+kCFtVqOc}>__TV+tUz--;C&8f0Lc{zTCFZ
zdk;+iKy<<XpHy1y2SmW2YW2KcD2qxN!31mo)rtN6{pLS_HnD9}_XA&g2WsC~I)$5#
z)T>}>)cqZohRd`-vKUu`m6k<l-O=Fg&CYITo=e@PPK@9)GCp(DZVuqKe}Ty?EpuVm
zzWdjk9J<utylj(iP{Jw&%s%3g;smIH`rKQ965yH~eNkCY3PjiE`dIMxP|#-uX2z^j
zV;o{SS?hLKV$yZ9)pye^O9%4+Aj7wx4)l-iCqfI%+hYRcQl9=xM_&PG%&JS?x#C`o
z9{{t=%*>h^&9>EkWFhv-{2d)cr(S~yD`av~6PLNOYja~m)&jzVSvzq0SK^JX_Sycb
zLiy+);+tR~=*92Cq}_xscn{NiAgIk<*GQ?TQ7Id>QT726X~@!a>Vm?bAptI&;A`Y;
zQk9IyruE7_@xz{nCwIvd%Duf6NX14O%kzxU<X;F@MXi)*hiz9Iq#(Y{H2Ik9N-{H-
z$=e_tSvRx=VkUlk7~&T#48)Y17mq+Dcz%bdz97lmfBa>8QQ{YQKghG9oAG}z^|!oI
zr3h2zIKQD0{67d8q|Ug~8rs?_PS1LHkEO!0Je)wySs>w+`y~UgO<luFKx~2X_a88%
zj1Ic2BzV^rnrpk8w7-n~X~h5pXjPTLFV)W=14}~J9$+0E6#oI$ceNlInPY8`?puMq
zzY-j}82lb)jBMC~x6_Wb=C>s|YM?NN3=TcO;wWWnRBLW-1}H?UEqiTY_I=;*z<%!U
zVx>hbA>*~mLKjutCXUZo&OS&8=$DsN%t(-weefhvgXnK+C;?RU!v~n1qOSMRnj$+D
zVR8GP{!*8ZwS+)P7(j2sZFp9{`3M)9WUGtj<86SX68<^4xw$1JN~K6OtM4CfBhv@1
zvpnShpw#AOpObUPoQ=qb6I==srmk@w$3Fsf;CG0Vqa%<P?nDwDTiZeyb|S;ELbB_p
zIXNSQURY#>f)CdR@d8q=<9H+q``%B=<0x6`|FfWgjF^~>{T};3O-pNN^u}YH1ct4;
z9%5VB%<!y0!1Z2{7OPtUl1{4~moPRu8WA22bNd|ZSUv%b#3;PcyxPb*`z`oS1VKXl
znypAISo}juoM0g7A~&q7rw64m)zzmBbbmx%_hGRmi%x(XF`aVO6x13Tu!*Zjt?>)k
z*jJc^le5BNh!*L;r`uBmYn4hLtPGC^m0iqh3DrNzl%2ZPZaafxT+<z_1W6jHQ2zb<
z{W2dAJ5_cn{RD=1i&{xfw@e4U+C`F~{e`W?>_H`vZy-yRK<EX}fjSbGPCk(cg=FSL
z85g>Pu<*RCIqTS!ZwsZdGb$}Zu7b~bW0?LjU!{WxD6?Gb_c#HE3n$1Zk8JD92OE@G
zarwQ96tR|aD=Ij9@PT6eQD48Y`-%F}5rv0Q>3l*xQNw%g7tjb#_w_60vuWg*SGb`q
zC%bdDNcJfw*R!_v6Gl)3fR0Fytol9wVg;4V`rW9K`NhS>KY#wrvy!?cVu37WOH!9O
ztjZ$|QfWQK$;xW5@{n<VIhszOa9`NI)p#s`r~#dfh~rqODNzn^JqrtZAa~jKjE|3x
z=4;7SJ-JccVwV*U)Vs)T4F#ww5ow!vqqCQN3N4?C01bM{G=L!`{%m4EB4gp;DEqW1
zj+{$NQ?onleOUcXP%y#i49CFLAyMTEjhF^>0WJW;K>9v_BBzlC4t70&6#I?ZB49*m
zgmVqOt)ay=5@yrR#y>k$zI+7;tEs68K$Z%muJ#vZz5f&ox>Hb5Ooz-k0g7;a(B7WZ
z0NY3Wy+0*K(=FPx_nMiR*<SK53%lvq*chE6F$6102jOf{frSH2N>1(xd+$i*nz8#k
z@?&jP(SbvThhX|XWyPV7fX~^F?7_j8|85{9J|AO&yd(e;Pa<%?`cI3kST-#?A^#21
zh%K*ctKBJ@tG{LAC{Y-6hX5C!cplmU5{z8cE9hK}ljW02!&Cz{9#B~kLm!b{wJ#;R
z05?&l$$n;vl$4gzgM))X6^3;1+5Ud4ru=b!@jDa~IZAMmYYSbRV|&BG3xe$BYFJp<
z@bK{6T6}JA_Pmc4l8SY5t!t}lhN|5MoOv72;i$+5D={!Iswxd_EiKvEg&mK#bxyjd
zj7V<nTX(<ULfP(=+o;3UK18LVpwmVi3_E?zfAK!1H&9aByDD2;X7m@t4tu7ZsU3i|
zg$j_Okq5&G@O*YEQKTSB-XOQwviD1C0pUIJC-j<p3HY2p*myf?etv!uljw&JAKK@n
zKl~RkT?7h-?A|zmBwP>mUardV>qeG98u+0tpfHd{nyJh}d3;W~Zsp)&*RqySdp~V_
z=XU5%Xe&wecKbc#!xMPHqM(z7v}s{(F8Zxj&W7~$5HP6sSz5;<I$iCL9B)|2k;@$o
z3lAR|9Zf<Wm{}iuui@J-TFpv8IIlzoYUVih)8{W-fiy&AD<?`jw^e(z5YO%+=(N;J
z{=#!PoEbzvau8>Xr%ykqsU?F!ywCOw*r^<&3pfv#qsgxfjE8Jtt`s6J^*1FBj%?0H
zM|;qUly55g9lKj~P7^k~p7Zs3Nzy3D>a65@Wu?nZjZ+d6sH}kc)E(9jv}mMMs@s_O
z(|(}^=tJRG6gh@H5e}yUQztNw<Y|@pXHXl|^@=j&GRA>YzUa+Rp39KAdD3Bsn*pj;
zk;NAE^M=F-0+86=*z1~&Nq%VN?NY1s*}1&rGiZ9I=f2jcFzPZ|sl7!GXTd}#0}+Px
zD?=jkV+9sC7y_s+2Ybo9eG41FqCW2Z^y@BD=K>y&dFdYb&U0u3zsoOIE4jAOYXbL+
zww~rDB<lGY8yYrUt9}HC1G;jsgr^x(-oN%24q|%)sU!qak{i&O-=#V0MP`OTndf#<
zah;<;8?&j6m!R~}Ne`r62v$IEZ}0Ku7}B2gz}NTpw`wa@fs6_g-c3hC$nI6DZ0*~l
zfqyP^?4+J+o$4W%kU+-s7mRf_eR|5IH^ZE>u;tINVo;52sXbBk@wr6;Q%Pb8IAg2p
zHUE%*1TwieNnT&4jFa4sBfT<A;*nhV);c--r)~9F>~V?<|KJvKyzV-=nAg9EXV<rg
zSuwl#k#>GhOH2EV^sWBwPi4?*OXYRx?e2{+ztsS^k`?F!Rdv}eFqPZwTd<a3)(hSe
z7(89drCX7I4$iE?w5>YhM_@+m#Q8{+8-+n8=(Z_wi0PsNDV{~)hkS~?ZBspH9ySMJ
zN@OUq^UC1pk-04#;y@pfUtM=>@3QS1?p`+C>g+Kr4rEu{d>El?&~<OerQO;?`qO0&
z71V~?VQJ~TZYJO`&A9;8^BDJW8Q3T(M9@(nFcMPI=?d#)DSTxR9Ho~MDXqqipqP*b
zWZ*AmdihuZV0(n*AK9MYqs=k&xokWvOub2_d*-tM=ZEv9eU0nVmU?dMteX@hn<TM9
zfzzrDk_-zpS~3$5$7^+C(4sNx^*h2<aDavBdU=fP^)*BX5eQzr&%6-Fg%TG;Vp?%I
zc@BD5q?cNX#{2<J<6XSH6<Y{b-#?f_MwJZai$vZJk_S-|QfRE`oetDt8X&9^z->oV
zh!D>Yh17UHgP4|Ks1q5F<12*E0DU@vLb#2Fg-?0u?PDL;@{KXje7>^fr9}Py!{@4}
zSLT?BAeW>s!CK&OJSoB>)%wzXJuUsx?3&D?^Bq~quZyJ}DzAjXrG--?f?z+^TyU$C
z@g{@`vJ{<`miB_zInkI^j5e#kyEkC`&)V6IlStpJ#g~?HgY<*cBtRPhil4|jX!|8D
zj#aUf?zm^3({1vSJR>mu1=_+&49v_nR^3O=b>Kc~8$@5~qpj_!F|rj7n%(TYB=S3x
zd%YVC>$mf%Rlg1Y29gtd@90HZUt6Q%t8I8^{W#$w=DIENRNgH8U>hG#{@QKj?_9z3
z?Kkr6ONG;(Dyi{%0S#3irvwSR*B3?&wU<90@A#yhw=FZ76u!`H$am^0s7!iRku2A(
z^`GuN9<}Zs6Ar}x-E0IGIZ58c&~<mKG7<`oi{qiwr!sC(=G}JkGdDyn%==Rpk=u{i
z;ZdKXBRhrLv)cM1yPaw7)0Ll~84Y@MxVZB(=S^?8haG^L1>_eg_}Z&;*TYkR(nXKk
z<&j+<uj7#0{XYsjdi#rycXaoc5~N4HR(PlQVfyu7Nrkw>>>=b@L;F{oKlDIrWk-KE
zIVGW2w@PU*fo26+AE~OwpQUfS5q%0dr{tD(wV6tpf62e56UiZid0}^64E%m<>n$C&
zX#DiV8_L{%r>B^hAaN%fvzmaq^y^oOYwd5B30Ne=z5KU^*CCJfYFBsRmm72W*L^Ny
zuFhul&2&2xRH$213KgBK!w*yug>AGfr4QR70DKN2^$ZLRnzv~@ZVtU{r_Y;fZ1cuT
zwu&dougaXa<1;R3ZwA{xlm>_5uIUNeVN;R<L}<4N#lRIi-M#G{vhDErv@YR7zRo+s
z&w~w%J6&k&)s^3A*u5I~&Al@MoBuurxmgKrrs*U9#(dSnWM;fb^6XTKfO&JI(D35S
zDQsyT*M-Y7$9SfaT(kVDIMC-{$V2z)9Mh8PHhsOvNZaoT^5TuX7?wd3qq_jd7gBC+
zYV@3$F)Hk|vIEx+2iuwB_lv7LGv~nw68_DnK4)Es%2}sAhTH4iPF2R+0ruOyIX$<V
zhT-c4TwB!{$CKl^+S=<$OdZk-^Mzc>MU5N(gDlVk(npQ1>~(tVk#!i)HL>&E$NBHG
zgZRl8aG&ck$1>-iA6+G8uczM426at+a)~0Fd=cYuL5hkC3lh(eh#=KKIOm^#MK7-S
zm2;lBmA#54y5GsQtnbe0gz|M2O5uI8F~33Jt#~T5U%%^fv%NdVv)7EN<GsN}H(JN5
z>a!j2b4RGCod}rLzwc2f%dPtFLW*vd=sX0%12hO})nz9tZS^J*1*ez_?atB<qR(iO
zndqe{gO)f^mGrdXXIRv+4Ssu9-yi;_+y#69FRvCIf8r@F84v~#F1wt?hMg-t$xz)|
zbJNG`8y)w7j^Ok61{0U@fEZMMX)s=O&&!U{UjZ)eg<hLV;?t4r5h-<f<PK~7!=t<2
z#OXe9f1hQ2Ydbc=dm#-M{3vJ^{Z8;r(br3^Fz)BHe1^s9T3T8_<CDT)Ufvwd-vpO-
z?3JkqcQ7@v7}0=_34KmfD{8cIcXvl#Y57-DDkBeN6lY{(1%=RTY?!_x3xL)GlHW~G
zpg-Zz%H}1OSPW%@D>3Z6km!Pn=x~Nds?)+nuOxwq+=BJzGt?PJXJ_keW_V&5vjy;@
zV|)ehgTtRiY<uqy#@+_&D~=<_L;c<40&bZnb6T@?7<TT=Alh16ySKzbPg3h9t8GC|
zGQh+DRb!NS5c>EgNWT~lm~IK>ix^gGTN@~h%nV!N00RRT7}!1PX)^{we-zZ$Sz6hi
zn{O{RH=Iq$2wqQTN!;k4wKcGpY;YCU?vX4$znvQSr58FnD^#RT36@|_@SE}_Xn<v8
zG+(P{mXws_=QA}&iWx=+15OFl_%`Q;w<VuimJ@bsuezBMQm^s{%x)u#6K>D{Fzg1`
zp5(?(-4t_)WRgC?_YVbS_bL|SJ*WMJmY!rT5dB%j#h)A<hr8kQoSdZVACp}zFUJc~
zbtcX#GoJgf)?Azx<ay7XCHXizHHQ!M+*04P3LXRm$Ugegf&<zIQ4CM;1!DfNu&~(O
zT%Ci0jg;GdsqyoD;4uZDA}%OE`b}#%NmhgaH75@t_mq3N$+7D-ztNjia=lxLMawxK
zr)xw;;jOgQ<?(D#R7cUKPw?)oe(iC^S#e>jf*|28b0}s#c7r`1+2T!>%st=<@z{*`
zFL8naQ$IR70#`LI#(^G%NpAD;<FCTP!u<T1B7?8Nn59~kE7eS!<O0RlyKS2`spCiU
zxg<UeCHph6TC>aHPhd}rXBx11_iPuo^&(QQY-%?<T=nFx4$@qW`>hz_Ujsp4>!rGS
zad27(`sFl*{n7fs=#NKQ@Y<r=U<VH$PxrPNx(a;qse>`wksGJOR$Ef{?S=}QD;eIh
zx|<2y^2#cazR@{{z_glMFXOhtDT;&Er*N=Atf}+dVx5NPQ$8|VYif&TWD$DmxDCUE
z<h&*)D3VAe4%zOO267brJv1Fhwv`*#3JeJa%)b502{u=6!OIRcg{p?sx`pM+nYq6B
zdBCb2eS~={zqBl=r<Xbg{^l~p7)*0cki%S6ZB<}Opct)ZWUW0u?)aK2k0EzU0p1;v
zIQ8_jU%jOfDZ9}V+Z1@&ymWFZJ9=FhJ7xRN^a%sopAGz@G?6FGB)8`FZGv)ESF>7l
zn72+_N4WbpJ^KSEu16)@?}b_=33Y)a18zC-FjD}K5NX2>Q2#U4iTS3-eEIUDY1sjr
zZ27@Z^S*7%+)d|^-BH9@GI=s9=t(SI3b62Rc}G_I_sp^=-WI?o=j;Nxa&7DbFAlUS
z>#wAERq}5ZLi?^7oL#*~xX855`CY0!T4HzX#xOe@R7!fErCwe#!DsnHn*rd{Achdj
zsU8uiB0^vzE@G8e?#7o55gb>6Yo8k;>g(7>$FNe>*G^SFtAG`Q{>I6me;Bwcx#=pj
z;ZlFnvRk)fVNFCB-!4={IJ4h3-3Ps>yp_4uUThkjLsT8RcvN1!J6-XaLM$s>R(QJF
zbu|!8Ud+$e^l4A*!`ewwIYpE|8PCnhV+N83lX^`)8^A5>KHJOMjk0j@1-Ddcr&TBv
zsn#&1>r1YlD<pR{Vjb+YcyQH>an{#d(e$-o_GLwz!7s8swvBrZ^_&ay+WTvFOiu@8
zRxKMAbrU<v`B=5c3q{7_lcyVO*Yd7icF2X=i)@?Kk~uwRp7G}H<Y?&`2KE&4sn?y*
zIgb~eNF64`0}LH2M3#IyIy%bAL!fURLB{XCF`NU3!vReTM!m^<?(ge2|J=UGb;B&u
z=K$`m5ZYHX9B{k3>*BpLyFMRrxzTX-m4|oQ>GlL9bHl&|a_j2V{jnK?bKJt2+oARO
z=nsYQ0?H<Vba0*1?hR>PzRSaPEqf7_x})h_sNm@aR96z?xk>VC-EqzHrix=IO@JE1
zhF<P;-TF8FDNCH@h#on_2IlVE(8WsHs3o`&sqnU@riPkE{rdWvDq_Oh;T{sH3;%uT
z)GF;+o@T`g0Th<~Oy<K#s6xZV;RolRZuO3b4w2&qm+Y83+D?Tph~XEPdII}$E^oCj
z<}`2T8z$4P2cV=rXQj?>k27w^j~m;z_Ij@?kLFyI<)0Fe*O#A0HxxDdr+TKX-d@JM
zs7XD~JrukpcXnNELG<No%|A2ayxwx$W_NyDZq(DEL$YOOxVzFDKjZw?+q}?i8zoV2
zeOI<G0R<-@K@{!o2CNw6U5UbWY%-Gm{k9w2i4{gxc>klfsM@o^^^j`|s6mME@W6n<
z=!=U<lW^d=rj$piZ(~O$QmsF9(EN_}isQEiuRci;4R~Ri-9M6Y*{#U1B$&VQv_421
zm9y^){JX}`yOU$pF<e0BS9IC&SWn>*c5f-vGJ3Ia(Z11X<h5S{ykJ1qZ}wsxy=Ny|
zfIwR2o=G3aWfNxUKxyEl*EctKgl`l}iMYb27YTGz)-FvHKdRu<B_F4D9>|?)j#~CP
z5sj529#g+PP)c}H^VHp5%5Ld>S47uM&C~D~s28MB-#TqNHMc^HMJq+cr$^~t(qoqA
zslnD8+g}@VnQYr<TLklxl`VaR(op=f7hk`lR6i*4_F0Lp24Y6<w56agG~%(Si?%8?
zm1g=B6;;VbT-zUs5=xzft6aK<ur=vsi=(Y)oi#_t1qkw{Us8k<OZBZsco?xdh<}#d
zX9LBZM^9dzWECu4+<T&Oa1-G9Kxt=1WeiumQ?@!COVe$cd)S`zXsL2lq~CbE<Y~v^
zyd9?ZS)n`kWJPJQF-Z*i{RL->`AYAdkdncR2`B%#HTu4q=^s=tsl%*dVrAh**z$`z
z6stA-Q^IdYv`ZE%Bt9uz*i9xaanf|Fif39WgJ<8{(9s=X#L2M@p&XKaBuc<J^?Z_4
zFc7i1gGk1Eb^5o9b*wzp&RI{sXo-$zd4dpYLYX~2e6-J6cZsOdW83D#cVmU)VCP7;
zx8d-pq1n<O6kBgmsgjqbW0d9OdEK(Da|wtq(bTdz@N6P+ZbEy8I)ayCglH<)E7nmz
z=gA}nTV{$@bjm*H;2(CDnLea2FF9EnORC4{5slhnMnC0<BG7-r<eS%f$S5O~XjVVf
z>o<2%-6M0BpSqQy6MZ=xIJAbUkz*!yH?8Hg8iH>huI8P%G>qxCUD5z{+~+}539bFx
zezT&|^yGZPg_m2+d^?YSxMVDN^g7AznQ*7yJUr^NJ!bt>xu3%d!a5?xTGEZ}fhgSM
zMThieLJ1Tz|2WpGk`A87y7WU}8P_^B;xE$YdReB1I~~a7?<d4~)C7vCnw_eh=;+NK
z9H7sK5!lfEh>^LsTtUBMf%T00uW;LOduTr=)pDA1U*PwSNox^X{}UWL%=)l3-9YCR
z4;*px&GM~{>BAl}@N3PO)MY!k`@|<M@pk4-T<l)um%Q+UCxJyDal|=0q-gt!*~BPH
zEGy-7pDdYVGklmFmC?$Gr7(8Wi5`q^k(EWQ$&VhZ))*?U+%h$k?)R$QO3@g?QwSbK
zjRXIlzVCAF#P8SJ>5^0Z5spAJ*am^;=e&a8WpH##bJ}j&$?1PY*FCB*YCh_?{Q=)}
zbG3fMpX{n1?ygZ^Ai2&CzjAzlyl?vd_w`FZ>D}P(m4WR%6Br(`5#PC_Y@el{E}+EU
z!+BJcS?#h^;zAX>@4FMo;UZDsWoJGQ?zHQuJwX+TlV`;hN(1tmOv0?o!0e1->$ap2
zs?iR!s_JWp89B7LysjP7x2Pg)+UDn|?chpwk>mP940i00n3x!DoPeYH7$zJd>Nu_o
zn>bWDgP{Hc+$bk%4E^<(0_Npqv~|n!_c!0r;+?}UGy;;C(5f)YoVt(jE`!6eNERbr
zdCe7~$N5syu;olhuF-b9c2tt(e^t!v^4vL+Q77~|_X%v17DHoTxCv)^xrzaY-bD|e
z2D4H^sB%Jj7U%o>Xck|Z9%ny?(>Au87e%e;THGc+Ib9sM$|-f*!K+mP6wA)>2sEN-
zsmj#&Z_>f0=oFD9-?EZM<Ag7<6cXRpsI#-O8;tuu@ycVK^9n+EV$OKE=uL}IN0yZO
zHi2FO%k`)>9e?#Z4~^}Ctm$oynTUy)&WbJqn-uN~H3ZuH$sGLEOTOgQl1+PMf3xIo
zjH5FLahNL3$;)~#u;GD->Feik9cO}jc$`2*7I9bIuFm>8jJ+%`z58lJyW>SZ-elg(
z=^z%ZrhXo>$sV&9ma_ViDWlwuAVyJiCI!)`B%T~p5%h0XMUU{bBqW3JH>wII9}&BB
z1Pi@uYK#$Wg6K;&m?MnATsKOz)_puA>y|TQGdf@RI8APov~4OWteX<8E#HVx(>+?&
z$n*M3I>wS2(XHgnq@*{-j9xafrA^_lSzyY0PiP)o$CgQObmBxa?|XgQS>+ftX-Vr+
zX;VJYZkQDTvtteqio4Eb6m)|r$z86Op*HK(cMnR?!)RjZJskTAs*8ohjd`7>XY}aH
z0vR*{P(@6uNigwPkiI8%YB3=&d-7%QO_G~(*?V3c1`{9plwufvDFBP;e<=L6Cx^hR
z86KI_LkO9)87L;q1o!LeXJvHut>!nV8a7@Oh-^0+H<B&pAKgkqY2c#bD|LA9ES1SL
z>?>nuT>wQa=UTh{v_`2EEbA`&zAu`_ijuv!<UWvK>sx*d8&+XG{Xtid(?xXH&LN}=
zT>X{o#d`3yOlTY*kW;eJ%Qz5gCa5x&z2dLC>-dEzkXO_HKfeL}zkO}xf5;5}`{RGV
zf?_b89x!k=4Nc8ovFXLdikp%KPEO?!=s6RBH_$G8f@K|NCDC`9l~92jnmo)BjS&cN
z-h))}+#18fpOOTM+~iKh*3ZAM#*pFnxh)s_W+de4NBrPdjVD!@;GH|oZPfks1P}Fo
zC=FAD^_q#cCJzbiw1EDOU)t03Fg)3&s29VnIyZ7K7JQ*+-*r@elfGhi4&VCD&pN%|
za`=yZ`d-A3RpZ$G7HSMPCUo{sa-Zu|uwQ{!!n&NZ;z?+&2o~@|CU631VwHXxYfnnQ
z7<;60^Q}Tb27f5v5lCAnx)lR1r;;n3nWPWs6RJ<z$D1i>G>5F)w%K$}-nKLLy*4f&
z<DsCbsriRe%cM1X%^7Wio)_%WrrOL5@KrmS-SVqV)%P83?1h-wlJbNl4K?T&Y{fJ+
zyP9icQXUVsuyJ{0Ix>g3aFwU;X9Y^OIms;PA-YLDb12_ahh-V2J9Yids63f-iG?;d
zHs9J<*;X@a5I+O&Ors9rYuuDGB`~Qd?NlhU$;2;K+zhf*A2V6wFY8gnDoIGJY#yx-
zfqua9jYfmF7r3v%tQ{G=m0|VECO@9Ry8l=Y7N^tyqLOA(mhPAQ3oeZ>5$N<TS|4*@
zo>%^eS2^D$l*p0~qOw03$a(HwF7Or}T8|&jo>hOVv6|pCIaP}c<7J-q8qjEBIwfV!
zU!Sma>4^8><L|1Reog~*uHVpN_WpE!qm{6IVsh5x)sXkmwT+SILsP%hgvyI(pY2@P
z*6oPRXK1HSB-yY`7l<|DhEWf*LaxM`)L%36@4G2Tt1q#DF1uq#M|eq@fYMJ{#Tvh~
zqtBW<0;=YS?6L`I8`9OR?Ce(2`?o5psvAuvRLgqSN;Bem;*JE4r~ExN*8MXn&pYyK
z@iy49vZqGTU7oY87ql?@c%S(6lVIZua?Jkhir*f_mH|7lars?ZYE!*a65~}?>Nf-S
zLU!<q+s1&j+x4nIB8i{gAiCLX$C@n^eyxmySg!c<!sS#3jeVkxMekR;9`dAsrqXy#
zev;|ukJ)8QHe)y&Af21`G@K?svWyLEPr=|IBTi*VTrP=@Ns%q*xcs-KXXyx#f1I~9
zai3njS5zDr985>AB!N!RBd7q}ZPiDtaU!$|5Jr(w_G$^Tm_a|X&7SWBC2l}h=IG&C
zL~~AGxhNS;k+*IZ$aE@JHSkYfj(<X+!&6f7wZ}D@cFGY;#w9e++CAaFkJ-rzKf12Q
z&P{Aep`w!seCmUnal+X`PpAx@z~V9}5Q3)yoyCLIa5}|4S)zgEz6yLsaBG$^zKpG6
zJ}O(3Hfue4MM{Q|zIbH%6NOx)^+Xo`V4L(q7mAAKvC-4E6<ed7;+<7i`C(l<Yc?A@
z2rXtBC5c>Aueb=r()eWEC>lHo{-Hexf$vt;zfT%no9u2p{r_I8G0pPMe)s8DdSiku
z4Qk`*o$of)OxPtZHRuP0GtjI{f$~uH6UF$9HqrL<%%re(BPY=bqo08sZX`vHQ7nJ&
zTR3LE!Jhomo;kIkKB#H&#vr7iSf*$@p-ftnGSj*w^4o_c?^2p6i`Hyn!?eYcoEr3|
z(q#}jD?7!5{2#L0L6(poqwI>?&v`?Qzf&L<zg|E|uollSLp7l}VVaV=xWin<yBY8C
zEWs>(r+l=SE^#pMiH?UZxh#c;fdVJRVvU}2mo-R;y`8#KFNSd_7M+zg89aivqT?QZ
z42}w1`-ER2J44pTslSfAj_`jS%=J}4t!+!QzPZU>it_RsQ2Z<yfOuz0V=c;v&yG7L
znMQQqSEcM*mHf?p-wAV%c{X;4zVo1}-BaZMw!uVpdyAr4U~MH;|2q+^4k9HcFIph1
H|K)!Hg>$~>

literal 0
HcmV?d00001

diff --git a/img/blocksizeComparison.png b/img/blocksizeComparison.png
new file mode 100644
index 0000000000000000000000000000000000000000..58a8e1b330778bc1e4ca9f571e3a02401142a98d
GIT binary patch
literal 8994
zcmcI}byQp1x^HTfQk>!%q_k-97A@`$#R6?1cyV`jDZwE{3lw)RQmj~u1cH>{t{Vy3
z;6>lc-uJwF&mV8Rcg}rxjggVD=3HyeZ+`asecy`E(oiJ8qrn4#Km^K4aylT;?Ew(z
zmKyGDU_@&>02lbX<)))31F9UNLjyN=t)<naL7?imhnH{f0rwA_m5kg#Ai_@U?-s(T
z7zzS0Hz><V>v@~)&O5}hj{Edr{Ml4LUNToP|9*J3)*EU0fzF7`s0Pl(`AUqUPlY0K
zmQedcJh2Vk0P?Q6sPGBRZH1E=DzTxSj+z~w55K;6zeQW#y7Q2Vx2d@*&2K1Eci!~S
z*~+i^S}I9FzeqzOqq4-!!{g@|W58XI+h=i~17s5CU>60sum$K@81JJG_#n3oF)s~+
z$N?z7t<{|lx{aS%lWXtcw?Lp$CP3U^4qR#wC>u`(2LvkqH;2PIxEtnbs;gZ(2}A@(
z%QpVF&oDJNH>P3cHSe*CX?&WozcXE1%B2{`;Gygj&93p83LmGku!(054XXt2wtJaf
z%snEHrF)T!cX5F9oQ6;uLpZe$w}k8>gXfu{ZyZb;ou%nN@hr9-lv>jehJ_t9QwKN*
zw3;*XP1y+ASq*qyo?*&eeWD4;3Y$2lyJ3|%2UMyTXMZm>w~fL}XMWRwOKqsR6~k<n
zKW9KM${EORA<pp4=Zc|OHJ;P2Yln(O^NayD*%U=Eo_BgalW<Ss985qx*ViEl2p}Q<
zgNiVWk_Vy{QTeI)j9~;`y)yR2ad&S&Amt>yg50w@$G3(3@Z@##(K#m-e{g_YZwF1}
z={Ln#I@`#ZVq?h4aU1u=vu?&@MhRa%ryV*YJw(cWO_!cgsIk^IW+hYHWkpWcBH80;
zLR=De*w=V6TfH&1-E-+{_cwo(4rcrVu1?{Q!m)m3Q!b`XHCElGs>N8d(EbUxP1%%|
zQk;m*l`%5uE5|;pYuV4*Kf2mN`gp@Z$v$?1m~rM^lCD`2g#mqqv}c{(xiR8Y#(X1W
z-S-uTZvgj`(ma<6?tm9a_%i*Wg1ldG-_AJ7touC;2G7E+v`U$KCCP@MHq=#g!Nz)g
zOw@EQZ*<|DZDIz(o`1iLjKx#PG(!HN{l^_Hc}-&eFR+!7R8LxJ(*p=QIpr&iytrr%
zamv^d9a9^fJ&6~)G@Fahpj9f*b|$U8b5mnyZ!`0;VJ3d%<C)aLO*@z4)5mqR)0vx%
zkes^4ikf33``VOUtLhCjUk@kMm|O*IWThba1x1;9x?To`Cz=0i%le)mG%+`##-QE<
z!5ZL!OqnwIDWlM0=Mq@xo^R>roBWg5#WSLh`2MV~c~@%v5|?}sR?1u_o5F`KFJ4)%
z?@2Win2MOPS6)}<nSD=)Pbw~?jOeef{L%I@h0=F7y|hVSRCC{Mn`SN~5?Nc>J0IdH
zyIPuE*2KF=bIMgQkv{Aw*XP~`CEIFfiP%KtZK!(KmKhesH9xw_rHp7L-EV>-sAgmE
zbR3_k%r(d-Bv<9d8eHsKq1zJUL^*64Or;^<`BpW$_h)x|XQXTLV(Aa<zS@qvM@(ju
ziewNX5V@}HjkZzU_J0<rXn*HzPUijzw}GloW@(6e+amm#yM0@-){G*}z|c1YgFFGc
zgYMu3i{JbXf%mCfl{}AAo}kDDxFft$T|8n%+>F~*{Y$ug2-c1zwrOiJT*8WWt>%O4
zx9!j?E?@REkUXr($O$XcnNo=LV_&3A^OTLd_%xpaBL#W>9Q;(S-&Y4x<WJv!wO^CS
z&Nh>ix}e-UT%(Sfu&1o@t_SZM4v>HS#Ci58(lg49t80C3T2(GJeu#Jyb&ZHJw`4J?
z->?knB0N)byE@>Kufp2ll0qd7Ei)ae1Tm2?nlLgR@%8YGu=CY1&EUCeyDk*>S~!-N
z)jA^1)wg|`(!j%z5=fcsQG=IyP|Wr!UcJ6j8ky9kV6jmvYI*Oe$e(?$Du<hIcx>13
z)^w)9QS77h{dEj7_3Q6ORymIHn_?gKQ{YxN4g1<7A92yys5P;2G&tsRMN9BD4Ykxh
zYL&r8Z2w|Q)H^+!LhBX&t-hL}k@$(ST2(#WRTV0dVE)RvW}K%Y6?hn!{-s%yhf7RR
zsAWdEOyOJ|)IrFpL3aE4n_Pc0YnkpVxT|a?7k48&nCB_CA%_?g18w$8osjLF_^j>=
z3C$Foba^{{8!Sx84l|b%sETogO;Gq4AokKF)*kEa#UD*5?f5(m+^>WELs3Xx0x0s^
zY5aW2P~~+^9c$%~3#ZsOQADhKsE>VbGu(Bw@ECESt={8@I5P8{o5-9DmD@;k7;CN@
zZ<!}tQ(38RPxesujIK7&mPQgZ#f{Zua(xw^=ShxK7a0|MKs_(TgP9YgEAEDTFVfmp
zeFu2l0?$+{aZv#$q6XEwpj-eyq6?p_OU>jJQ$=xpz%K`z;;q8|sQlE%zok;-(poj*
z4Jq-+IhxxM<+K#3#Y#BSyf9!ph!NH>QR6(T$mCh6&Z;G^gDi5-!jlj1y3@5HdRRs`
z)Ap1|(uZlR#!ZBCK9;kN7gVh8dMX*@_Dyj{BmuGGM-Dijmb(Xv$<Bm)$fRP|ykyE<
zAmG?E%zHmGQkK~1$t%)omRYTxPc%jecE6rrz$v`dBQO@#3G*RNJ8Ogf;@Ba&pCdzl
z(oTY&BPP+$sT?dZX<LTK*L<m7$+-qtOlX!=5J`4TVRCWNME}_Bw>18q@RyELy)9@Y
z<od{Kw*7jA|HSCI8&_Op7lxaCnUizZm{#Z<sZVQ|l@^-cxVIaxT35dP4{_mXb;qHZ
z4aT$GI@M^a<}<O`LP3(S?D~Un+tIywwpln$sR!bb5JY-qLQiGQD5^VOn9pR7!{s^n
zgu|-oqXm(!WJb+u%@jl+Lur3An;nqRq}hCHgf1XmL6Dl#3)L-H8J||xw<*+Z8jegy
z6SBE@Oo++6PV-ovP#7KG3V8cYFY2N)xYWmSj#cSYw}!x$%>_L<Q)ilDB04DsudJAp
zYx(F9Am$h~Yq#K7B-pPAra{$<mspyD#d@a7jtJbhVS<@$!!th(i=br$Vy4LSSOb-@
z+m(+|wT1q;#&SYmxhKb%ZN*Y(UDw<ZH72;Z84)S6_Rcg<Ot@CUIrB#<Y=}l%ku)!2
z`PPue%AV$3rUXX*$+^H$I@(Z{V<}??X@npNxn9r-0r(C`=L7zmMPhyslRPk>?*A?;
z&;kVVjr#w|P~Oqv;{<A)dW$<o*1vOf^reXVg#*fFkx`KSE(4ZjvHqE<|H(PWHrXO9
zki(&o7zE-{=(TzB_PMfm%W-Vz!F@o=;8<Mh7(qk)uufdM5|mB8(coPW$S@p^GNj>0
z#%Y5<9k)M3_l(4;CO%6PNQ<z1oX`jGs)<<9#=^4gU^t2@Mgd7dW7}%+eK83H`l9<G
z+F^RJq-QZ6KTI}-))v@+=f6qBHl2EVGxg#R1V$9{v;`#mUZxd<f<SNn$b{irhAul7
zld$1S-Q#YQBWKnuE<~6x4g<W`_*fA7M4^iSKZaAnTRb1k(xcC<$_l)dc@2xkr3m?+
zec8qOKD4AwipRF_7N~>&L-ZQBGb_G0Ht<|Fx!|7<8K;^Y1c@(%y8{&Y%S%n!9%ls>
z6?`NCk6Hm(mb_=R8X+PqjFbb&wTc7*HUAZ?J6bk`x%<tt;qU`F0Sg7T>+CLOAK+av
z%EjxYA0~{SC2xjG7Tc~iYn`tD94OeoTK^h!v;VN+W~briC?Tc&x+6+)FX&qJRPrKp
z|MS&~#7{}rbDi2L@Yo{YJsk@Hzn00_U<M2RuOpWG+?+W1o=`mDv(Yji&hE;Vj*#vw
zauPc(G0B=i{ra63c6RatYi5W2mYW=z&clR$Jc9PXYwl3k{jBEVF6X0agG4IFz)dzb
zSk*PcO$9%FQ8MA)`v68sw~LaCtf}vm+y+>0{xZ}YB<ylUuW23NA0v&Do28jM{ajzx
zn;W3zkGiJwJIFmzuU5Dy3C{}%+&%~!<fAhNIC@8p_C;-kDgHuo!*)R9#$=UUP@Tn$
z#BRRl@tW$sZNt~Y!M8^^!1B(6<zv=lG?neEwhr6C!OM0R+;{HncJ4}DRGe)1wfm@F
zoYYz`3<qXP-o&2#UYTVSL<Ii^JS*7Pe^r|PFz;uZ&rV;|;_vaY260!7t5X6msZMLM
zfS0`>&`yN!rnOms0sTpcrfCZxL@CS73{lad>)BjJQ7uo<{+%p!Iv%XFq)sgt7aL}N
zr(F-7em^8`xOP7e=;IAK4LUs|!O2oDmjJ4XrMw27ptF(f{oiGYry1Vr8CN0<{;1cm
z-uUmau%Ch3N0j@iR=A6<-oHws+Wq&`H(*3J9T~7=#a>XbS>xq*#!E%&NRq{iL3^+3
zl}o8h@AI!J-Qlg5<UQ7oQXZZ2KW!v{6YOnTRL$LVb$KzJb=;QeH4KXT+?MY}dd)Q2
zz$WB>^#|pZOQDlS&sATeJhj(T3Bm2#Uw&`|^y`qw8N{_;U*F7M4y$@yUba+`&mj9#
z7W_5>+PEU*&uRIEMMSQi#~+lG2G;wXe~S0cR^A>Rd-eIfyl3B3|I(Kg&e+4qN&sb=
zb6-@6yKi}HB$4r|wKr8P7fco{c8+wgJ(yy-Vi-S5UfYP%xVgJZOVqY0!f<{Sa9OY@
zA=Nan2zkTnOT+(&X<Z_8oUN1?+)1Q#c=p!)hAbiEw{A5(LDtoTZ5X*@B`8&8v1V+=
zIHLVETI9~m2jMO+4sA_MS%5subqss|J~{zHIJPTqf#~aI=D7a1pRYD{%^>ql7aktJ
z_Rv>Vo<dLVJ|}oW0i7%-r*841X>5Am`QFJWmmN4HvmriC$N^b`Ahh_s6er2z&E|`n
zFiC=DmFCV@KX-W`0Zn2a$9sG0S0BINumvmKnND(%hc!0kg7>Oyeu+sDxunR4oZ~Ql
zy)P1azaj2E&)!v61J^Au)E$pnTlz&_%dU2s+GFeC@4Spou$#+q^nL5jR)pr_RYH-_
z-1YG2&E=B&**a0?_3XZ87;XE-QOeD3B8+$Lc<lAu3;Ie%`mT@%CoX4)VrdeSzY4w;
zAy$@q1B(2kX|Ausiu{*ou8$Gw_BK>EEw;=AL^qRYn`Sch^d33ygRzs6wdIYQ+Ie4w
zSc&@idOo>+#INIhr*=Vx>#c=d$|2d$a6X8a-}Q(W<Mqz#Li@A+X(No6)Te7^8$?~F
z=m$iW=sX?RdAB&kzPXw3tPyI>m{Rwc6ymn+>t<OLa)ZZ&!&n&BNS*in28@#RhvzS2
zQUW(7Mu{2OZ4ECY;umTZ)rojt+nI$@T{gWG?vm_s-qvjJ8tGI=m?_1{$odCTb|M4e
z4R4lAk~brO484XE^ed+;8@~KQkA`1x1&L&)4f{=-y~%tK2@B_<8M`mHPxW0sq<w)=
zc80!?e)+pNLHt_}oHok`N`Na2w3+j*%~Gk5hJ1g?f|)E8E)#2=T~>Cqc(cFYeR}%Q
zBGc!1zLyUOv%y|IMCND7@R81p_UDY?9-@MyrTquKQ>%;g<%p#l?F_<e3aF_6ZkWOR
z7=~D#K7{eZM?$m%0}*<Vfyh6Cs`p3)3fkW4lv2B4(Z#oI|8$aenqhODuOxe^{}FaX
z7I{<~v7`II*Bzuv!VdzyBnQ$3Nb4Suxj=f-K#l?F14#dW8I}){?Rk&*cqVOw2^JiM
z+FOD^!=*)F7KU<TNo=ezsiUIte1^n8pm{8O@yS7k8yUOOkTNjRh%GW;`OV69Fw1*+
zdv_&S*lMT(7FXRBdkq=*b6rp2e5q<f0LFNZeHSt{z3&gH`E!+YFfBmBeb!stlm0)E
zE0P9}nnz8(R|(_t;P0K3++LeobT;rkdV1L%h4G#n_>?;CfISX&KkNYk0`vcL!2hZa
zK%W33IcE$@xp_KAB(Iufx{{_NsX_n()ot1KY6X8f4HisMV~ndO2i$@wmqcn2;2m7!
zqwpLm5|L+uZA;qwPq}4)jkELqg6xW)uN(-dJD0z30nb(7Qk%-cwronQ0MO;?M6hK@
z@@R*~#Kc(ThV(&QaX`Ue^9U=^TcVq`y;MUs(1oiALFn_hiPG3ThDYJx+IFQ3S6{9C
zUn!!9RTnHqb2vS=QlbSEio#+nsFWG{ulJB%@j;^%SfmW0ld+6aZPf`IskcDE0SzJW
z<;-t_3~}TS1xLnaYmZ1uz6n#|uRO4(?-o#Tms8i4S@VmQ1c8o_j(gCvl6+gjDFmEv
zzq(kAoJf3I>HCl40Cyh2l;YcfF@pC_*r7XlXqKtdJl<1{Eo*_+Xi^1i!t`;+x}+yG
zNCqal<b7JjFylp{$DCG>#_-co+opzV(%XN4gw|C^JIB{It|$xEDCaNoLy)@ZZHb_v
z4cXfJzuwMQ=?!0)XUvm>4J#duq8k;M>GJzJXh}8gNMgiHp8I$+)_Iq6B&{bEV4ZKL
ziUZ6dYB4#csae|Z^~qVzImdfsd_>5aHnLlt`iJ(*^wGwLx}`07aFXvbt7z18tV|D-
z|HU0p$Bg#<Np}x=NIHD^Jk>M|A4Ork-Dp>(*W}k5p5&Luqqh45tN*0NgpWEta$$Sm
z&KBD0Ci(yfb7@t#MU-*66WrTLwww_#r?Z0$thhz!R(>DT?C=PDS#Vell3@Vw)?44K
zz_Nmza!tuGm{>5&-b*Dt&!up6K!<ng)8X3sX$B`U5nYU)z&`foYcjBW5mrx!FNZ;#
zgdorfiUStCWAV}S*9I4s5I0f)wgny(!t#m#W2^%{-*xkV`-WZdMSsGNn+2@%Vp;0F
zn|-(L@EyjG<XS=WyYKCbz{EFTq9CkMH3xG<!oJ4E7L7|C3q<LglK&v6Ogf=;LpnK9
zJT5N)KE8DM`;c8TlNHKEM4hJBG8`V*bH|D@9RML<QfzA}t<n+9hJW?vYJ8baXkzWi
zqxd19k6YnO&kqxz(Kgp|bk0etJ#rIg_-UnaGr+3O3P>=v4F``p84f%bjE+}q7Z#|u
zdg>rJdij781foBZz@AnGYvgRa&}dGBN^CypkQDRU`|OJ4YyVo-TVF3^RMe5w|N2>o
zA<i^jLLEp01EZsGKAISSCVc(8c0Yd*2<6~PfH@>Gtnh^Pj21Pd)F!@I(cZ@@@jrEv
zSbH>@l@#ve3Wx{zV1|r>p4L!!(?hk#2?8KcIlYIoy20cv#uP{rNB-xeKuA0rDG2lo
zODkMMq|UU=wc@dwSSicKqoWP`MVq}Zg~?MD30PS%knHIIF6TxZ)7Hg{af!k4OJX2V
z!KV$l3jJwimCc_~)eVsr5Twxc%u+ecUH0viTfPCV=UgGK3T{GD9{}2MzIu@7)f%{p
zsI5)@1GwHE-v<`E!bk}l9Lk3O8-*WG`WXJo`e9-nqmVa&1T>+qDXSoU$d&n?VtsJr
zdEA?Oe>)NzEc_wO>&s%Vm?xgaaA2dCURMOvBwRI{T0^8#*-3wmU`rg9zf9_mK(HAU
z;PqKaT>k33Cbgl8Lu7vI_@~G`5`^Mg3$D<T^VHp|ZA`$f2-G$sb173(zZ{~0IuRcw
z%K6{Lh`%8dkTg9#J@BRS@8|KZ$?R-?X#g&LDk=h72+|DtjoH0WWz(QV%Z>s5XAa1q
z0<be6nOsHOtJTx^2R<kfP2ZWL8~~c=d8p!4AVeRM@HfNoV{DQUK*6Nr4{_Bmg-;lr
zH&s_J|KRzj@-7?L=y~49gKN1L{SR0On6WVk#AfQ1{8r+q?0E{yV048Mhf|^Te-|D8
z4kj4|_Ri&DA|C1(1$C0YD(z~>dHyQ~I1cEgB48p|=UX6~pLvU)JO^fj;nfftu0-Lp
zuDgE~(*0QSF?CO-$MqXP-uP2L-vYh)4>E^K-TzeoSGOjB0g-T2-<xNjuI_E)ES}%R
zHU$2)k03oW95;VZ-RP9NU!J)%L<q{)-e5|VjnTl@4!f|Uw-U9UX^}U6vudwRE2QS+
z*5j9*r_|Vs;4}!fb9#5>s;(r(Biap_o8)fj<>Q`qgFT`w28@`#aOkW`&7mUstM(>b
z>TTts65ewfjM1m$O=!leEs0ZN%s2Wmb9zRd+8+P)&CeKH78>mwMgQt3#CaoIQIf9$
z_tK#v%gV={0o0#cr+4+y?=Y!k?lZ+XBL|z3LZn3y#$tN+7E#$1nS2+KC~I3*8pYa`
zosn>k^6L`$UPCuglGVEeAMi(czXXNpa$uaCF8NQ5?8(r0n+Y82Tjx`Ufnyud3P=G(
zha`{c0D-D|#{H}LTS>UocJMR($k%o7OjEND@IUMotc!lgrLw!nTCqDip+zRtSsfG3
z3fQ2A+vKlf$U^OSM6%iaR5#)@KON<}Hjt>ZT3Vb)L!$DZrfK_7^N&F)BA~74VisuE
zank^?-AjYRd!^-H-s4i+YZSdZiJ~uhI>NfFY63aNr55g|GB}R1%WAAd%Z;G_bW`JA
z|G_X)LP{^I^{wgIIg!ZZJ1b2ztMbnTerPf3+=sbad8G{gP(R)Z_iJ<zb)Lqnw?ZWR
z6R*$H%LVu^D)wq^Z<@wKwkQovL(hZt26ijzB3QQ{zxXPrIPaSiN62K)cFJ~@?-|aZ
zH<J8uqI`nP#XP@AcLs7U6n$3U@;du{zX2K8LITZo<W%K%FRM+|%f~BIh1U+HvOa)P
zJDL(Se-|2k1gSZSMp_+z2<%@sT^V=WBOejTMg<+|3WfsR5_X*|T15myyQFB|92W|5
zK26hJ*SjS`11#Gl^(?DOR6QL{?W;9f<!B#5%<q2YNUf_}mxQKsqqMi(KruFVi6EpB
zlJgCMQk00?J_+8>y1Z8y*q)YK@x#j8>R4<jAo1F`#7K{{-PbYo$eafS!!k(F)xSev
z|4vQ-E1H~gey*0)JDibxu*v``e=LI&90HfvP)?)1Ps?A|yH|hj4J8oUgztgWJR`Qd
z^MJae8DNjkagBO`<`^b%D+C{yB?aH<knRPjyuzO$Tu_^dqtV3FVqPShI(kBp+qQRD
z$5Ka`5>sk!0(@9Z<;&}vCY?2j!@v7x61%j_?+pAT?^iVZBfpmEmYkOwiPtL0z$~U5
z-ci-$stuM4k%-abM4?+dkN(<a51N0Ax%sfJUF7&Yk`k?i1m}4qdq){t3rHl$ht<V;
zKAvx8uZ_O_M)9x3Dfn4`NYn7^Jx`x@jvfw2);2Pwm3gSx_YynlF&jd`EEBx3&#7f_
zzEA?%xSwOutCcZ5pfDEkF_GoH(~Eq29$S|%fL}w?4}F2ueennU))EsG+)3ZEPnJ*L
zj+cSMT9NmG<iSf$myAZD<)(*wqQzDeHppQXj;DF}!KN%&UG0tOeta+j|ERC(7E&ry
zU}DQ61M{v#a9^FVOfb&6@;s={wDNtNeEW+SmZ$!Uh1Y+rOa8Z6{|6UY3I^H_G2E*d
zLpDSl<LRH%wbm98LA1QiA@Un-jDlIaLRzkDF9CU2_QwNfJ!>~N-57B?!t`9nImr>V
zJ5#hWIL<F0@sIr$A`{r6&k(M`wCZl8RjA)$J0HsMY~}2}#T;vy%y+^rP-4`=;b6}A
z`eF7@pa*@cPX=~gJMFhlkW{p~B^`i}Niuzs7VV0-r`_i+Uu#s2GpKKk#uPKz_I`1_
zVu-_yub2p({OoB`@#v42QWCj_OQz(z6^{d$GRMLL6+-053f?kLq>j`>bZcwWZ7NlO
zk2p3WAi%uu{EntYMA`$^bsHqVzV6)E6Au7-Z)QI31}mf<s;Iv1Mo}5BH#Ew!%Eo)7
zr_MYsL`BMR`Syf+gstJwZ6Y+RX591inoO$MeUzOiaLwXEsO9>rRO{uYsd23=>|}Vb
zI3S9JpT3bu%0BW5N{Nd!#<rHyS}d}puzp;Pbwt0UEuB*VbQkc*-KbOX^nwqqM3ak{
zI)lnRj_t9$8&$+SLUrOs{&zX!yT*q{TrrJzCX|}jqd9D($A3;#1x{{1s;YoEcwt!_
z7u!yN_m$JNoV`Yz3&pcStJ%40g;1i`Qu<WK$D_Md2ZamK4?`a7Z+avTZpwFY##Jbl
zGrnYkf@WhSd@uqHSxB89W-!e~&n=)~=e=gho_O+>kKrxz!&`^Q0<}Aq`=4|&W*xtA
zo5oQXAkY{?lct$H9x30+ZIM86)dzkwZRd#n%guCSw`PHv4P0tbXk6o}=C>ey)maCZ
z)o|fuq|x9zGIV%i6)y<u6-bRIyPf9Z&7K}HwpTuDI)#6@4;C8jG07hbrB<?^zlmv7
zo$zj&(TDFv$13^Jf;+>?N#eFQ$|vgNqPmvt^N*c#wfcR<%h2P#a)R-W@<MqMx2V8(
zo-=KI7-KP>;4NH5eYLMCX+7>9*gQxdsW?uw?eO?aE3*@vf}E(L|K(j?0omo~^;8hs
z=|olbTz})syYRB#EMjL1;0Cg=-Nd6on(u5gD)kQr)f;j>3e!PM{{!**Y_iF1LxbXR
zg0cWDX#IK6bqfzRHMyZ_T-K0DR_0N7>3pD17QQ)Wn|U|)ztHxmidD%L0zd##me-K0
JlzH?1e*y0f9q9l7

literal 0
HcmV?d00001

diff --git a/src/main.cpp b/src/main.cpp
index 7305641..c335103 100644
--- a/src/main.cpp
+++ b/src/main.cpp
@@ -13,7 +13,7 @@
 #include <stream_compaction/thrust.h>
 #include "testing_helpers.hpp"
 
-const int SIZE = 1 << 8; // feel free to change the size of array
+const int SIZE = 1 << 10; // feel free to change the size of array
 const int NPOT = SIZE - 3; // Non-Power-Of-Two
 int a[SIZE], b[SIZE], c[SIZE];
 
diff --git a/stream_compaction/cpu.cu b/stream_compaction/cpu.cu
index 4c7a86d..bad1976 100644
--- a/stream_compaction/cpu.cu
+++ b/stream_compaction/cpu.cu
@@ -25,7 +25,7 @@ namespace StreamCompaction {
 			int oLength = 1 << layer;
 
 			// Uncomment the timer here if you want to test the efficiency of scan function
-			timer().startCpuTimer();
+			//timer().startCpuTimer();
 			for (int d = 0; d < layer; d++) {
 				for (int k = 0; k < oLength; k += (1 << (d + 1))) {
 
@@ -41,7 +41,7 @@ namespace StreamCompaction {
 					odata[nodeIdx + (1 << d)] += temp;
 				}
 			}
-			timer().endCpuTimer();
+			//timer().endCpuTimer();
 		}
 
 		/**
@@ -72,7 +72,7 @@ namespace StreamCompaction {
 			if (n <= 0) return -1;
 			int num = 0;
 			// TODO
-			//timer().startCpuTimer();
+			timer().startCpuTimer();
 			for (int i = 0; i < n; i++) {
 				odata[i] = idata[i] ? 1 : 0;
 			}
@@ -82,7 +82,7 @@ namespace StreamCompaction {
 				if (idata[i])
 					odata[odata[i]] = idata[i];
 			}
-			//timer().endCpuTimer();
+			timer().endCpuTimer();
 			return num;
 		}
 	}
diff --git a/stream_compaction/efficient.cu b/stream_compaction/efficient.cu
index aa23383..3ee98f8 100644
--- a/stream_compaction/efficient.cu
+++ b/stream_compaction/efficient.cu
@@ -11,7 +11,7 @@ namespace StreamCompaction {
 			static PerformanceTimer timer;
 			return timer;
 		}
-		int threadPerBlock = 64;
+		int threadPerBlock = 256;
 		int* dev_Data;
 		int *dev_Map;
 		int *dev_Scatter;
@@ -23,7 +23,6 @@ namespace StreamCompaction {
 			int idx = (blockIdx.x * blockDim.x) + threadIdx.x;
 			if (idx >= nodeNum)	return;
 			idata[(idx + 1)*(1 << (d + 1)) - 1] += idata[idx*(1 << (d + 1)) + (1 << d) - 1];
-			//idata[(idx + 1) * (1 << (d + 1)) - 1] += idata[(idx + 1) * (1 << (d + 1)) - 1 - (1 << d)];
 		}
 
 		__global__ void KernDownSweep(int d, int *idata, int nodeNum)
@@ -61,13 +60,11 @@ namespace StreamCompaction {
 				int blocknum = nodeNum / threadPerBlock + 1;
 				KernDownSweep << <blocknum, threadPerBlock >> >(d, dev_Data, nodeNum);
 			}
+			timer().endGpuTimer();
 			cudaMemcpy(odata, dev_Data, sizeof(int) * n, cudaMemcpyDeviceToHost);
 			checkCUDAError("cudaMemcpy to host failed!");
-			//	for (int j = 0; j < n; j++)
-			//	printf("%d ", odata[j]);
-			//printf("\n");
 			cudaFree(dev_Data);
-			timer().endGpuTimer();
+
 		}
 
 		/**
@@ -91,9 +88,10 @@ namespace StreamCompaction {
 			cudaMemcpy(dev_Data, idata, oLength * sizeof(int), cudaMemcpyHostToDevice);
 			checkCUDAError("cudaMemcpy to device failed!");
 
-			timer().startGpuTimer();
+
 			// TODO
 			int blocknum = oLength / threadPerBlock + 1;
+			timer().startGpuTimer();
 			Common::kernMapToBoolean << <blocknum, threadPerBlock >> >(oLength, dev_Map, dev_Data);
 
 			// Here I reimplement the scan part, because in the main function, scan and compaction are timed seperately,
@@ -119,11 +117,10 @@ namespace StreamCompaction {
 
 			blocknum = n / threadPerBlock + 1;
 			Common::kernScatter << < blocknum, threadPerBlock >> > (n, dev_oData, dev_Data, dev_Map, dev_Scatter);
-			cudaMemcpy(odata, dev_oData, sizeof(int) * n, cudaMemcpyDeviceToHost);
-			checkCUDAError("cudaMemcpy to host failed!");
-
 			timer().endGpuTimer();
 
+			cudaMemcpy(odata, dev_oData, sizeof(int) * n, cudaMemcpyDeviceToHost);
+			checkCUDAError("cudaMemcpy to host failed!");
 			int count, end;
 			cudaMemcpy(&count, dev_Scatter + n - 1, sizeof(int), cudaMemcpyDeviceToHost);
 			cudaMemcpy(&end, dev_Map + n - 1, sizeof(int), cudaMemcpyDeviceToHost);
diff --git a/stream_compaction/naive.cu b/stream_compaction/naive.cu
index 169230a..8b21cb9 100644
--- a/stream_compaction/naive.cu
+++ b/stream_compaction/naive.cu
@@ -11,7 +11,7 @@ namespace StreamCompaction {
 			static PerformanceTimer timer;
 			return timer;
 		}
-		int threadPerBlock = 512;
+		int threadPerBlock = 256;
 		int *dev_0, *dev_1;
 		// TODO: 
 		__global__ void NaiveScan(int d, int *idata, int *odata, int oLength) {
@@ -20,24 +20,6 @@ namespace StreamCompaction {
 			int flag = 1 << d;
 			odata[idx] = idx >= flag ? idata[idx] + idata[idx - flag] : idata[idx];
 		}
-		//int threadPerBlock = 1024;
-		//int BlockNum;
-
-		//int *dev_Data[2];
-
-		//__global__ void CudaScan(int d, int *in, int *out, int n)
-		//{
-		//	int thid = (blockIdx.x * blockDim.x) + threadIdx.x;
-		//	if (thid >= n)
-		//		return;
-		//	int m = 1 << (d - 1);
-
-		//	if (thid >= m)
-		//		out[thid] = in[thid] + in[thid - m];
-		//	else
-		//		out[thid] = in[thid];
-
-		//}
 
 		/**
 		* Performs prefix-sum (aka scan) on idata, storing the result into odata.
@@ -52,31 +34,13 @@ namespace StreamCompaction {
 			checkCUDAError("cudaMemcpy to device failed!");
 			int blocknum = oLength / threadPerBlock + 1;
 
-
-
-			/*int nCeilLog = ilog2ceil(n);
-			int nLength = 1 << nCeilLog;
-
-			cudaMalloc((void**)&dev_Data[0], nLength * sizeof(int));
-			cudaMalloc((void**)&dev_Data[1], nLength * sizeof(int));
-			checkCUDAError("cudaMalloc failed!");
-
-			cudaMemcpy(dev_Data[0], idata, sizeof(int) * nLength, cudaMemcpyHostToDevice);
-			checkCUDAError("cudaMemcpy to device failed!");
-			int nOutputIndex = 0;*/
 			timer().startGpuTimer();
 			for (int d = 0; d < layer; d++) {
 				NaiveScan << <blocknum, threadPerBlock >> >(d, dev_0, dev_1, oLength);
 				std::swap(dev_0, dev_1);
 			}
-			/*for (int i = 1; i <= nCeilLog; i++)
-			{
-			nOutputIndex ^= 1;
-			BlockNum = nLength / threadPerBlock + 1;
-			CudaScan << <BlockNum, threadPerBlock >> >(i, dev_Data[nOutputIndex ^ 1], dev_Data[nOutputIndex], nLength);
-			}*/
-
 			timer().endGpuTimer();
+
 			odata[0] = 0;
 			cudaMemcpy(odata + 1, dev_0, (n - 1)*sizeof(int), cudaMemcpyDeviceToHost);
 			checkCUDAError("cudaMemcpy to host failed!");
@@ -85,14 +49,6 @@ namespace StreamCompaction {
 			cudaFree(dev_1);
 
 
-			/*odata[0] = 0;
-			cudaMemcpy(odata + 1, dev_Data[nOutputIndex], sizeof(int) * (n - 1), cudaMemcpyDeviceToHost);
-			checkCUDAError("cudaMemcpy to host failed!");
-
-			cudaFree(dev_Data[0]);
-			cudaFree(dev_Data[1]);*/
-
-
 		}
 	}
 }

From c391a2a2a65dafc1454b9213ea6535e432229b8a Mon Sep 17 00:00:00 2001
From: guoyi1 <guoyiybb@hotmail.com>
Date: Tue, 19 Sep 2017 23:38:12 -0400
Subject: [PATCH 3/8] Update

---
 README.md | 114 ++++++++++++++++++++++++++++--------------------------
 1 file changed, 59 insertions(+), 55 deletions(-)

diff --git a/README.md b/README.md
index 8da03f5..6ae9274 100644
--- a/README.md
+++ b/README.md
@@ -6,7 +6,7 @@ CUDA Stream Compaction
 * (TODO) Yi Guo
 * Tested on:  Windows 8.1, Intel(R) Core(TM)i5-4200M CPU @ 2.50GHz 8GB, NVIDIA GeForce 840M (Personal Notebook)
 
-##Description.
+## Description.
 In this project, I implemented the parallel computing algorithm of streaming compaction. For more details, see `INSTRUCTION.md`.
 
 ## ScreenShot
@@ -15,7 +15,7 @@ These are the test results of all the method I implemented.
 
 ![](./img/result2.png);
 
-##Performance Analysis
+## Performance Analysis
 * *Block Size*
 I compare the time cost of scan function under different block size value. The result is shown as the graph below.
 
@@ -52,59 +52,63 @@ As the plot above shows, `thrust::scan` is more efficient than the scan methods
 
 * *Test Result*
 
-	****************
-	** SCAN TESTS **
-	****************
-	    [  34  28  17   4   6  42  43  24  15  44  27  19  13 ...  43   0 ]
-	==== cpu scan, power-of-two ====
-	   elapsed time: 0ms    (std::chrono Measured)
-	    [   0  34  62  79  83  89 131 174 198 213 257 284 303 ... 24338 24381 ]
-	==== cpu scan, non-power-of-two ====
-	   elapsed time: 0ms    (std::chrono Measured)
-	    [   0  34  62  79  83  89 131 174 198 213 257 284 303 ... 24197 24245 ]
-	    passed
-	==== naive scan, power-of-two ====
-	   elapsed time: 0.057184ms    (CUDA Measured)
-	    passed
-	==== naive scan, non-power-of-two ====
-	   elapsed time: 0.057216ms    (CUDA Measured)
-	    passed
-	==== work-efficient scan, power-of-two ====
-	   elapsed time: 0.157728ms    (CUDA Measured)
-	    passed
-	==== work-efficient scan, non-power-of-two ====
-	   elapsed time: 0.153376ms    (CUDA Measured)
-	    passed
-	==== thrust scan, power-of-two ====
-	   elapsed time: 0.156192ms    (CUDA Measured)
-	    passed
-	==== thrust scan, non-power-of-two ====
-	   elapsed time: 0.023776ms    (CUDA Measured)
-	    passed
-
-	*****************************
-	** STREAM COMPACTION TESTS **
-	*****************************
-	    [   2   0   1   2   2   0   1   2   1   0   3   1   1 ...   3   0 ]
-	==== cpu compact without scan, power-of-two ====
-	   elapsed time: 0.003695ms    (std::chrono Measured)
-	    [   2   1   2   2   1   2   1   3   1   1   1   2   1 ...   1   3 ]
-	    passed
-	==== cpu compact without scan, non-power-of-two ====
-	   elapsed time: 0.004105ms    (std::chrono Measured)
-	    [   2   1   2   2   1   2   1   3   1   1   1   2   1 ...   2   2 ]
-	    passed
-	==== cpu compact with scan ====
-	   elapsed time: 0.009853ms    (std::chrono Measured)
-	    [   2   1   2   2   1   2   1   3   1   1   1   2   1 ...   1   3 ]
-	    passed
-	==== work-efficient compact, power-of-two ====
-	   elapsed time: 0.212384ms    (CUDA Measured)
-	    passed
-	==== work-efficient compact, non-power-of-two ====
-	   elapsed time: 0.219104ms    (CUDA Measured)
-	    passed
-
+```
+****************
+** SCAN TESTS **
+****************
+    [  34  28  17   4   6  42  43  24  15  44  27  19  13 ...  43   0 ]
+==== cpu scan, power-of-two ====
+   elapsed time: 0ms    (std::chrono Measured)
+    [   0  34  62  79  83  89 131 174 198 213 257 284 303 ... 24338 24381 ]
+==== cpu scan, non-power-of-two ====
+   elapsed time: 0ms    (std::chrono Measured)
+    [   0  34  62  79  83  89 131 174 198 213 257 284 303 ... 24197 24245 ]
+    passed
+==== naive scan, power-of-two ====
+   elapsed time: 0.057184ms    (CUDA Measured)
+    passed
+==== naive scan, non-power-of-two ====
+   elapsed time: 0.057216ms    (CUDA Measured)
+    passed
+==== work-efficient scan, power-of-two ====
+   elapsed time: 0.157728ms    (CUDA Measured)
+    passed
+==== work-efficient scan, non-power-of-two ====
+   elapsed time: 0.153376ms    (CUDA Measured)
+    passed
+==== thrust scan, power-of-two ====
+   elapsed time: 0.156192ms    (CUDA Measured)
+    passed
+==== thrust scan, non-power-of-two ====
+   elapsed time: 0.023776ms    (CUDA Measured)
+    passed
+
+*****************************
+** STREAM COMPACTION TESTS **
+*****************************
+    [   2   0   1   2   2   0   1   2   1   0   3   1   1 ...   3   0 ]
+==== cpu compact without scan, power-of-two ====
+   elapsed time: 0.003695ms    (std::chrono Measured)
+    [   2   1   2   2   1   2   1   3   1   1   1   2   1 ...   1   3 ]
+    passed
+==== cpu compact without scan, non-power-of-two ====
+   elapsed time: 0.004105ms    (std::chrono Measured)
+    [   2   1   2   2   1   2   1   3   1   1   1   2   1 ...   2   2 ]
+    passed
+==== cpu compact with scan ====
+   elapsed time: 0.009853ms    (std::chrono Measured)
+    [   2   1   2   2   1   2   1   3   1   1   1   2   1 ...   1   3 ]
+    passed
+==== work-efficient compact, power-of-two ====
+   elapsed time: 0.212384ms    (CUDA Measured)
+    passed
+==== work-efficient compact, non-power-of-two ====
+   elapsed time: 0.219104ms    (CUDA Measured)
+    passed
+```
+## Extra Credit
+* *Efficient scan optimization*
+Compared to the basic algorithm, I optimize the kernUpsweep 
 
 
 

From 6ca64cb3a71994a9ea8a7eb909e5d609b4820a60 Mon Sep 17 00:00:00 2001
From: guoyi1 <guoyiybb@hotmail.com>
Date: Tue, 19 Sep 2017 23:43:22 -0400
Subject: [PATCH 4/8] updated

---
 README.md | 38 +++++++++++++++++++++++++++++++++++++-
 1 file changed, 37 insertions(+), 1 deletion(-)

diff --git a/README.md b/README.md
index 6ae9274..84269f2 100644
--- a/README.md
+++ b/README.md
@@ -108,7 +108,43 @@ As the plot above shows, `thrust::scan` is more efficient than the scan methods
 ```
 ## Extra Credit
 * *Efficient scan optimization*
-Compared to the basic algorithm, I optimize the kernUpsweep 
+Compared to the basic algorithm, I optimize the `kernUpsweep` and `kernDownsweep` function by reducing the branches in it. 
+Instead of judging whether the current index is the power of 2, I computer the index we need to deal with directly.
+
+	__global__ void KernUpSweep(int d, int *idata, int nodeNum)
+		{
+			int idx = (blockIdx.x * blockDim.x) + threadIdx.x;
+			if (idx >= nodeNum)	return;
+			idata[(idx + 1)*(1 << (d + 1)) - 1] += idata[idx*(1 << (d + 1)) + (1 << d) - 1];
+		}
+
+	__global__ void KernDownSweep(int d, int *idata, int nodeNum)
+	{
+		int idx = (blockIdx.x * blockDim.x) + threadIdx.x;
+		if (idx >= nodeNum)	return;
+		int nodeIdx = idx*(1 << (d + 1)) + (1 << d) - 1;
+		int temp = idata[nodeIdx];
+		idata[nodeIdx] = idata[nodeIdx + (1 << d)];
+		idata[nodeIdx + (1 << d)] += temp;
+	}
+	
+Call kernal function:
+	for (int d = 0; d < layer; d++)
+	{
+		int nodeNum = 1 << (layer - 1 - d);
+		int blocknum = nodeNum / threadPerBlock + 1;
+		KernUpSweep << <blocknum, threadPerBlock >> >(d, dev_Data, nodeNum);
+	}
+	cudaMemset(dev_Data + oLength - 1, 0, sizeof(int));
+	checkCUDAError("cudaMemset failed!");
+	for (int d = layer - 1; d >= 0; d--)
+	{
+		int nodeNum = 1 << (layer - 1 - d);
+		int blocknum = nodeNum / threadPerBlock + 1;
+		KernDownSweep << <blocknum, threadPerBlock >> >(d, dev_Data, nodeNum);
+	}
+
+
 
 
 

From ae6677de5208c24208a28df51c3ad5da236ff8e5 Mon Sep 17 00:00:00 2001
From: guoyi1 <guoyiybb@hotmail.com>
Date: Tue, 19 Sep 2017 23:44:49 -0400
Subject: [PATCH 5/8] updated

---
 README.md | 57 +++++++++++++++++++++++++++++--------------------------
 1 file changed, 30 insertions(+), 27 deletions(-)

diff --git a/README.md b/README.md
index 84269f2..edfca1b 100644
--- a/README.md
+++ b/README.md
@@ -110,39 +110,42 @@ As the plot above shows, `thrust::scan` is more efficient than the scan methods
 * *Efficient scan optimization*
 Compared to the basic algorithm, I optimize the `kernUpsweep` and `kernDownsweep` function by reducing the branches in it. 
 Instead of judging whether the current index is the power of 2, I computer the index we need to deal with directly.
-
-	__global__ void KernUpSweep(int d, int *idata, int nodeNum)
-		{
-			int idx = (blockIdx.x * blockDim.x) + threadIdx.x;
-			if (idx >= nodeNum)	return;
-			idata[(idx + 1)*(1 << (d + 1)) - 1] += idata[idx*(1 << (d + 1)) + (1 << d) - 1];
-		}
-
-	__global__ void KernDownSweep(int d, int *idata, int nodeNum)
+```
+__global__ void KernUpSweep(int d, int *idata, int nodeNum)
 	{
 		int idx = (blockIdx.x * blockDim.x) + threadIdx.x;
 		if (idx >= nodeNum)	return;
-		int nodeIdx = idx*(1 << (d + 1)) + (1 << d) - 1;
-		int temp = idata[nodeIdx];
-		idata[nodeIdx] = idata[nodeIdx + (1 << d)];
-		idata[nodeIdx + (1 << d)] += temp;
+		idata[(idx + 1)*(1 << (d + 1)) - 1] += idata[idx*(1 << (d + 1)) + (1 << d) - 1];
 	}
+
+__global__ void KernDownSweep(int d, int *idata, int nodeNum)
+{
+	int idx = (blockIdx.x * blockDim.x) + threadIdx.x;
+	if (idx >= nodeNum)	return;
+	int nodeIdx = idx*(1 << (d + 1)) + (1 << d) - 1;
+	int temp = idata[nodeIdx];
+	idata[nodeIdx] = idata[nodeIdx + (1 << d)];
+	idata[nodeIdx + (1 << d)] += temp;
+}
+```
 	
 Call kernal function:
-	for (int d = 0; d < layer; d++)
-	{
-		int nodeNum = 1 << (layer - 1 - d);
-		int blocknum = nodeNum / threadPerBlock + 1;
-		KernUpSweep << <blocknum, threadPerBlock >> >(d, dev_Data, nodeNum);
-	}
-	cudaMemset(dev_Data + oLength - 1, 0, sizeof(int));
-	checkCUDAError("cudaMemset failed!");
-	for (int d = layer - 1; d >= 0; d--)
-	{
-		int nodeNum = 1 << (layer - 1 - d);
-		int blocknum = nodeNum / threadPerBlock + 1;
-		KernDownSweep << <blocknum, threadPerBlock >> >(d, dev_Data, nodeNum);
-	}
+```
+for (int d = 0; d < layer; d++)
+{
+	int nodeNum = 1 << (layer - 1 - d);
+	int blocknum = nodeNum / threadPerBlock + 1;
+	KernUpSweep << <blocknum, threadPerBlock >> >(d, dev_Data, nodeNum);
+}
+cudaMemset(dev_Data + oLength - 1, 0, sizeof(int));
+checkCUDAError("cudaMemset failed!");
+for (int d = layer - 1; d >= 0; d--)
+{
+	int nodeNum = 1 << (layer - 1 - d);
+	int blocknum = nodeNum / threadPerBlock + 1;
+	KernDownSweep << <blocknum, threadPerBlock >> >(d, dev_Data, nodeNum);
+}
+```
 
 
 

From 2ee4713e62d6a61033740c5eaa9c7b5dca194f6c Mon Sep 17 00:00:00 2001
From: guoyi1 <guoyiybb@hotmail.com>
Date: Tue, 19 Sep 2017 23:46:34 -0400
Subject: [PATCH 6/8] updated

---
 README.md | 8 +++++++-
 1 file changed, 7 insertions(+), 1 deletion(-)

diff --git a/README.md b/README.md
index edfca1b..f8a6b93 100644
--- a/README.md
+++ b/README.md
@@ -16,7 +16,9 @@ These are the test results of all the method I implemented.
 ![](./img/result2.png);
 
 ## Performance Analysis
+
 * *Block Size*
+
 I compare the time cost of scan function under different block size value. The result is shown as the graph below.
 
 ![](./img/blocksizeComparison.png);
@@ -40,6 +42,7 @@ instead of:
 	}
 
 * *Efficiency of different scan method*
+
 I compare the efficiency of different scan method and make a plot below.
 ![](./img/ScanComparison.png);
 
@@ -48,6 +51,7 @@ As the plot shows, when the size of array is not very huge,  `cpu scan` will be
 But there is an another thing I don't quite understand. That is the `naive scan` takes the most time when the size of array is very huge. I think `naive scan` should be more efficient than cpu scan, but I don't know what's going on here.
 
 * *Thrust scan*
+
 As the plot above shows, `thrust::scan` is more efficient than the scan methods we implemented on GPU. I think there may be 2 reasons. One is that `thrust::scan` function may use the share memory to store the data and access the data from share memory instead of from global memory. In this way, it will produce less latency because it visits the global memory less times. The other is that `thrust::scan` may make some optimizations on the binary search algorithm. The best proof of this is that the time cost of `thrust::scan` will be much less when the size of the array is not the power of 2, which means when the size value is the power of 2, it is probably the worst case for its algorithm.
 
 * *Test Result*
@@ -106,8 +110,10 @@ As the plot above shows, `thrust::scan` is more efficient than the scan methods
    elapsed time: 0.219104ms    (CUDA Measured)
     passed
 ```
-## Extra Credit
+## Extra Credit     
+
 * *Efficient scan optimization*
+
 Compared to the basic algorithm, I optimize the `kernUpsweep` and `kernDownsweep` function by reducing the branches in it. 
 Instead of judging whether the current index is the power of 2, I computer the index we need to deal with directly.
 ```

From 868da7040edcb3a75539b5e409596d18d7b94e6a Mon Sep 17 00:00:00 2001
From: guoyi1 <guoyiybb@hotmail.com>
Date: Tue, 19 Sep 2017 23:47:45 -0400
Subject: [PATCH 7/8] updated

---
 README.md | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/README.md b/README.md
index f8a6b93..7625bad 100644
--- a/README.md
+++ b/README.md
@@ -114,8 +114,8 @@ As the plot above shows, `thrust::scan` is more efficient than the scan methods
 
 * *Efficient scan optimization*
 
-Compared to the basic algorithm, I optimize the `kernUpsweep` and `kernDownsweep` function by reducing the branches in it. 
-Instead of judging whether the current index is the power of 2, I computer the index we need to deal with directly.
+Compared to the basic algorithm, I optimize the `kernUpsweep` and `kernDownsweep` kernal function by reducing the branches in it. Instead of judging whether the current index is the power of 2, I computer the index we need to deal with directly.
+
 ```
 __global__ void KernUpSweep(int d, int *idata, int nodeNum)
 	{

From b6034a6589e9c93cd9630960540346ee7ada498d Mon Sep 17 00:00:00 2001
From: guoyi1 <guoyiybb@hotmail.com>
Date: Tue, 19 Sep 2017 23:49:04 -0400
Subject: [PATCH 8/8] updated

---
 README.md | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/README.md b/README.md
index 7625bad..0084aca 100644
--- a/README.md
+++ b/README.md
@@ -17,7 +17,7 @@ These are the test results of all the method I implemented.
 
 ## Performance Analysis
 
-* *Block Size*
+* **Block Size**
 
 I compare the time cost of scan function under different block size value. The result is shown as the graph below.
 
@@ -41,7 +41,7 @@ instead of:
 		KernUpSweep << <blocknum, threadPerBlock >> >(d, dev_Scatter, nodeNum);
 	}
 
-* *Efficiency of different scan method*
+* **Efficiency of different scan method**
 
 I compare the efficiency of different scan method and make a plot below.
 ![](./img/ScanComparison.png);
@@ -50,11 +50,11 @@ As the plot shows, when the size of array is not very huge,  `cpu scan` will be
 
 But there is an another thing I don't quite understand. That is the `naive scan` takes the most time when the size of array is very huge. I think `naive scan` should be more efficient than cpu scan, but I don't know what's going on here.
 
-* *Thrust scan*
+* **Thrust scan**
 
 As the plot above shows, `thrust::scan` is more efficient than the scan methods we implemented on GPU. I think there may be 2 reasons. One is that `thrust::scan` function may use the share memory to store the data and access the data from share memory instead of from global memory. In this way, it will produce less latency because it visits the global memory less times. The other is that `thrust::scan` may make some optimizations on the binary search algorithm. The best proof of this is that the time cost of `thrust::scan` will be much less when the size of the array is not the power of 2, which means when the size value is the power of 2, it is probably the worst case for its algorithm.
 
-* *Test Result*
+* **Test Result**
 
 ```
 ****************
@@ -112,7 +112,7 @@ As the plot above shows, `thrust::scan` is more efficient than the scan methods
 ```
 ## Extra Credit     
 
-* *Efficient scan optimization*
+* **Efficient scan optimization**
 
 Compared to the basic algorithm, I optimize the `kernUpsweep` and `kernDownsweep` kernal function by reducing the branches in it. Instead of judging whether the current index is the power of 2, I computer the index we need to deal with directly.