Source for file mime.php

Documentation is available at mime.php

  1. <?php
  2.  
  3. /**
  4.  * mime.php
  5.  *
  6.  * This contains the functions necessary to detect and decode MIME
  7.  * messages.
  8.  *
  9.  * @copyright 1999-2020 The SquirrelMail Project Team
  10.  * @license http://opensource.org/licenses/gpl-license.php GNU Public License
  11.  * @version $Id: mime.php 14840 2020-01-07 07:42:38Z pdontthink $
  12.  * @package squirrelmail
  13.  */
  14.  
  15. /** The typical includes... */
  16. require_once(SM_PATH 'functions/imap.php');
  17. require_once(SM_PATH 'functions/attachment_common.php');
  18.  
  19. /* -------------------------------------------------------------------------- */
  20. /* MIME DECODING                                                              */
  21. /* -------------------------------------------------------------------------- */
  22.  
  23. /**
  24.  * Get the MIME structure
  25.  *
  26.  * This function gets the structure of a message and stores it in the "message" class.
  27.  * It will return this object for use with all relevant header information and
  28.  * fully parsed into the standard "message" object format.
  29.  */
  30. function mime_structure ($bodystructure$flags=array()) {
  31.  
  32.     /* Isolate the body structure and remove beginning and end parenthesis. */
  33.     $read trim(substr ($bodystructurestrpos(strtolower($bodystructure)'bodystructure'13));
  34.     $read trim(substr ($read0-1));
  35.     $i 0;
  36.     $msg Message::parseStructure($read,$i);
  37.     if (!is_object($msg)) {
  38.         include_once(SM_PATH 'functions/display_messages.php');
  39.         global $color$mailbox;
  40.         /* removed urldecode because $_GET is auto urldecoded ??? */
  41.         displayPageHeader$color$mailbox );
  42.         echo "<body text=\"$color[8]\" bgcolor=\"$color[4]\" link=\"$color[7]\" vlink=\"$color[7]\" alink=\"$color[7]\">\n\n.
  43.          '<center>';
  44.         $errormessage  _("SquirrelMail could not decode the bodystructure of the message");
  45.         $errormessage .= '<br />'._("The bodystructure provided by your IMAP server:").'<br /><br />';
  46.         $errormessage .= '<table><tr><td>' sm_encode_html_special_chars($read'</td></tr></table>';
  47.         plain_error_message$errormessage$color );
  48.         echo '</body></html>';
  49.         exit;
  50.     }
  51.     if (count($flags)) {
  52.         foreach ($flags as $flag{
  53.             $char strtoupper($flag{1});
  54.             switch ($char{
  55.                 case 'S':
  56.                     if (strtolower($flag== '\\seen'{
  57.                         $msg->is_seen true;
  58.                     }
  59.                     break;
  60.                 case 'A':
  61.                     if (strtolower($flag== '\\answered'{
  62.                         $msg->is_answered true;
  63.                     }
  64.                     break;
  65.                 case 'D':
  66.                     if (strtolower($flag== '\\deleted'{
  67.                         $msg->is_deleted true;
  68.                     }
  69.                     break;
  70.                 case 'F':
  71.                     if (strtolower($flag== '\\flagged'{
  72.                         $msg->is_flagged true;
  73.                     }
  74.                     break;
  75.                 case 'M':
  76.                     if (strtolower($flag== '$mdnsent'{
  77.                         $msg->is_mdnsent true;
  78.                     }
  79.                     break;
  80.                 default:
  81.                     break;
  82.             }
  83.         }
  84.     }
  85.     //    listEntities($msg);
  86.     return $msg;
  87. }
  88.  
  89.  
  90.  
  91. /* This starts the parsing of a particular structure.  It is called recursively,
  92.  * so it can be passed different structures.  It returns an object of type
  93.  * $message.
  94.  * First, it checks to see if it is a multipart message.  If it is, then it
  95.  * handles that as it sees is necessary.  If it is just a regular entity,
  96.  * then it parses it and adds the necessary header information (by calling out
  97.  * to mime_get_elements()
  98.  */
  99.  
  100. function mime_fetch_body($imap_stream$id$ent_id=1$fetch_size=0{
  101.     global $uid_support;
  102.     /* Do a bit of error correction.  If we couldn't find the entity id, just guess
  103.      * that it is the first one.  That is usually the case anyway.
  104.      */
  105.  
  106.     if (!$ent_id{
  107.         $cmd "FETCH $id BODY[]";
  108.     else {
  109.         $cmd "FETCH $id BODY[$ent_id]";
  110.     }
  111.  
  112.     if ($fetch_size!=0$cmd .= "<0.$fetch_size>";
  113.  
  114.     $data sqimap_run_command ($imap_stream$cmdtrue$response$message$uid_support);
  115.     do {
  116.         $topline trim(array_shift($data));
  117.     while($topline && ($topline[0== '*'&& !preg_match('/\* [0-9]+ FETCH .*BODY.*/i'$topline)) ;
  118.     // Matching with "BODY" above is difficult: in most cases "FETCH \(BODY" would work
  119.     // but some servers may put other things in the same result, perhaps something such
  120.     // as "* 23 FETCH (FLAGS (\Seen) BODY[1] {174}".  There is some small chance that
  121.     // if the character sequence "BODY" appears in a response where it isn't actually
  122.     // a FETCH response data item name, the current regex will break things.  The better
  123.     // way to do this would be to parse the response correctly and not use a regex.
  124.  
  125.     $wholemessage implode(''$data);
  126.     if (preg_match('/\{([^\}]*)\}/'$topline$regs)) {
  127.         $ret substr($wholemessage0$regs[1]);
  128.         /* There is some information in the content info header that could be important
  129.          * in order to parse html messages. Let's get them here.
  130.          */
  131. //        if ($ret{0} == '<') {
  132. //            $data = sqimap_run_command ($imap_stream, "FETCH $id BODY[$ent_id.MIME]", true, $response, $message, $uid_support);
  133. //        }
  134.     else if (preg_match('/"([^"]*)"/'$topline$regs)) {
  135.         $ret $regs[1];
  136.     else if ((stristr($topline'nil'!== false&& (empty($wholemessage))) {
  137.         $ret $wholemessage;
  138.     else {
  139.         global $where$what$mailbox$passed_id$startMessage;
  140.         $par 'mailbox=' urlencode($mailbox'&amp;passed_id=' $passed_id;
  141.         if (isset($where&& isset($what)) {
  142.             $par .= '&amp;where=' urlencode($where'&amp;what=' urlencode($what);
  143.         else {
  144.             $par .= '&amp;startMessage=' $startMessage '&amp;show_more=0';
  145.         }
  146.         $par .= '&amp;response=' urlencode($response.
  147.             '&amp;message='  urlencode($message)  .
  148.             '&amp;topline='  urlencode($topline);
  149.  
  150.         echo '<tt><br />' .
  151.             '<table width="80%"><tr>' .
  152.             '<tr><td colspan="2">' .
  153.             _("Body retrieval error. The reason for this is most probably that the message is malformed.".
  154.             '</td></tr>' .
  155.             '<tr><td><b>' _("Command:""</td><td>$cmd</td></tr>.
  156.             '<tr><td><b>' _("Response:""</td><td>$response</td></tr>.
  157.             '<tr><td><b>' _("Message:""</td><td>$message</td></tr>.
  158.             '<tr><td><b>' _("FETCH line:""</td><td>$topline</td></tr>.
  159.             "</table><br /></tt></font><hr />";
  160.  
  161.         $data sqimap_run_command ($imap_stream"FETCH $passed_id BODY[]"true$response$message$uid_support);
  162.         array_shift($data);
  163.         $wholemessage implode(''$data);
  164.  
  165.         $ret $wholemessage;
  166.     }
  167.     return $ret;
  168. }
  169.  
  170. function mime_print_body_lines ($imap_stream$id$ent_id=1$encoding$rStream='php://stdout'{
  171.     global $uid_support;
  172.  
  173.     /* Don't kill the connection if the browser is over a dialup
  174.      * and it would take over 30 seconds to download it.
  175.      * Don't call set_time_limit in safe mode.
  176.      */
  177.  
  178.     if (!ini_get('safe_mode')) {
  179.         set_time_limit(0);
  180.     }
  181.     /* in case of base64 encoded attachments, do not buffer them.
  182.        Instead, echo the decoded attachment directly to screen */
  183.     if (strtolower($encoding== 'base64'{
  184.         if (!$ent_id{
  185.             $query "FETCH $id BODY[]";
  186.         else {
  187.             $query "FETCH $id BODY[$ent_id]";
  188.         }
  189.         sqimap_run_command($imap_stream,$query,true,$response,$message,$uid_support,'sqimap_base64_decode',$rStream,true);
  190.    else {
  191.         $body mime_fetch_body ($imap_stream$id$ent_id);
  192.         if ($rStream !== 'php://stdout'{
  193.             fwrite($rStreamdecodeBody($body$encoding));
  194.         else {
  195.             echo decodeBody($body$encoding);
  196.         }
  197.     }
  198.     return;
  199. }
  200.  
  201. /* -[ END MIME DECODING ]----------------------------------------------------------- */
  202.  
  203. /* This is here for debugging purposes.  It will print out a list
  204.  * of all the entity IDs that are in the $message object.
  205.  */
  206. function listEntities ($message{
  207.     if ($message{
  208.         echo "<tt>" $message->entity_id ' : ' $message->type0 '/' $message->type1 ' parent = '$message->parent->entity_id'<br />';
  209.         for ($i 0isset($message->entities[$i])$i++{
  210.             echo "$i : ";
  211.             $msg listEntities($message->entities[$i]);
  212.  
  213.             if ($msg{
  214.                 echo "return: ";
  215.                 return $msg;
  216.             }
  217.         }
  218.     }
  219. }
  220.  
  221. function getPriorityStr($priority{
  222.     $priority_level substr($priority,0,1);
  223.  
  224.     switch($priority_level{
  225.         /* Check for a higher then normal priority. */
  226.         case '1':
  227.         case '2':
  228.             $priority_string _("High");
  229.             break;
  230.  
  231.         /* Check for a lower then normal priority. */
  232.         case '4':
  233.         case '5':
  234.             $priority_string _("Low");
  235.             break;
  236.  
  237.         /* Check for a normal priority. */
  238.         case '3':
  239.         default:
  240.             $priority_level '3';
  241.             $priority_string _("Normal");
  242.             break;
  243.  
  244.     }
  245.     return $priority_string;
  246. }
  247.  
  248. /* returns a $message object for a particular entity id */
  249. function getEntity ($message$ent_id{
  250.     return $message->getEntity($ent_id);
  251. }
  252.  
  253. /* translateText
  254.  * Extracted from strings.php 23/03/2002
  255.  */
  256.  
  257. function translateText(&$body$wrap_at$charset{
  258.     global $where$what;   /* from searching */
  259.     global $color;          /* color theme */
  260.  
  261.     require_once(SM_PATH 'functions/url_parser.php');
  262.  
  263.     $body_ary explode("\n"$body);
  264.     for ($i=0$i count($body_ary)$i++{
  265.         $line $body_ary[$i];
  266.         if (strlen($line>= $wrap_at{
  267.             sqWordWrap($line$wrap_at$charset);
  268.         }
  269.         $line charset_decode($charset$line);
  270.         $line str_replace("\t"'        '$line);
  271.  
  272.         parseUrl ($line);
  273.  
  274.         $quotes 0;
  275.         $pos 0;
  276.         $j strlen($line);
  277.  
  278.         while ($pos $j{
  279.             if ($line[$pos== ' '{
  280.                 $pos++;
  281.             else if (strpos($line'&gt;'$pos=== $pos{
  282.                 $pos += 4;
  283.                 $quotes++;
  284.             else {
  285.                 break;
  286.             }
  287.         }
  288.  
  289.         if ($quotes 2{
  290.             if (!isset($color[13])) {
  291.                 $color[13'#800000';
  292.             }
  293.             $line '<font color="' $color[13'">' $line '</font>';
  294.         elseif ($quotes{
  295.             if (!isset($color[14])) {
  296.                 $color[14'#FF0000';
  297.             }
  298.             $line '<font color="' $color[14'">' $line '</font>';
  299.         }
  300.  
  301.         $body_ary[$i$line;
  302.     }
  303.     $body '<pre>' implode("\n"$body_ary'</pre>';
  304. }
  305.  
  306. /**
  307.  * This returns a parsed string called $body. That string can then
  308.  * be displayed as the actual message in the HTML. It contains
  309.  * everything needed, including HTML Tags, Attachments at the
  310.  * bottom, etc.
  311.  */
  312. function formatBody($imap_stream$message$color$wrap_at$ent_num$id$mailbox='INBOX',$clean=false{
  313.     /* This if statement checks for the entity to show as the
  314.      * primary message. To add more of them, just put them in the
  315.      * order that is their priority.
  316.      */
  317.     global $startMessage$languages$squirrelmail_language,
  318.            $show_html_default$sort$has_unsafe_images$passed_ent_id,
  319.            $username$key$imapServerAddress$imapPort,
  320.            $download_and_unsafe_link;
  321.  
  322.     // If there's no "view_unsafe_images" variable in the URL, turn unsafe
  323.     // images off by default.
  324.     if!sqgetGlobalVar('view_unsafe_images'$view_unsafe_imagesSQ_GET) ) {
  325.         $view_unsafe_images false;
  326.     }
  327.  
  328.     $body '';
  329.     $urlmailbox urlencode($mailbox);
  330.     $body_message getEntity($message$ent_num);
  331.     if (($body_message->header->type0 == 'text'||
  332.             ($body_message->header->type0 == 'rfc822')) {
  333.         $body mime_fetch_body ($imap_stream$id$ent_num);
  334.         $body decodeBody($body$body_message->header->encoding);
  335.  
  336.         if (isset($languages[$squirrelmail_language]['XTRA_CODE']&&
  337.                 function_exists($languages[$squirrelmail_language]['XTRA_CODE'])) {
  338.             if (mb_detect_encoding($body!= 'ASCII'{
  339.                 $body $languages[$squirrelmail_language]['XTRA_CODE']('decode'$body);
  340.             }
  341.         }
  342.         $hookResults do_hook("message_body"$body);
  343.         $body $hookResults[1];
  344.  
  345.         /* If there are other types that shouldn't be formatted, add
  346.          * them here.
  347.          */
  348.  
  349.         if ($body_message->header->type1 == 'html'{
  350.             if ($show_html_default <> 1{
  351.                 $entity_conv array('&nbsp;' => ' ',
  352.                                      '<p>'    => "\n",
  353.                                      '<P>'    => "\n",
  354.                                      '<br>'   => "\n",
  355.                                      '<BR>'   => "\n",
  356.                                      '<br />' => "\n",
  357.                                      '<BR />' => "\n",
  358.                                      '&gt;'   => '>',
  359.                                      '&lt;'   => '<');
  360.                 $body strtr($body$entity_conv);
  361.                 $body strip_tags($body);
  362.                 $body trim($body);
  363.                 translateText($body$wrap_at,
  364.                         $body_message->header->getParameter('charset'));
  365.             else {
  366.                 $charset $body_message->header->getParameter('charset');
  367.                 if (!empty($charset))
  368.                     $body charset_decode($charset,$body,false,true);
  369.                 $body magicHTML($body$id$message$mailbox);
  370.             }
  371.         else {
  372.             translateText($body$wrap_at,
  373.                     $body_message->header->getParameter('charset'));
  374.         }
  375.  
  376.         // if this is the clean display (i.e. printer friendly), stop here.
  377.         if $clean {
  378.             return $body;
  379.         }
  380.  
  381.         /*
  382.          * Previously the links for downloading and unsafe images were printed
  383.          * under the mail. By putting the links in a global variable we can
  384.          * print it in the toolbar where it belongs. Since the original code was
  385.          * in this place it's left here. It might be possible to move it to some
  386.          * other place if that makes sense. The possibility to do so has not
  387.          * been evaluated yet.
  388.          */
  389.  
  390.         // Initialize the global variable to an empty string.
  391.         $download_and_unsafe_link '';
  392.  
  393.         // Prepare and build a link for downloading the mail.
  394.         $link 'passed_id=' $id '&amp;ent_id='.$ent_num.
  395.             '&amp;mailbox=' $urlmailbox .'&amp;sort=' $sort .
  396.             '&amp;startMessage=' $startMessage '&amp;show_more=0';
  397.         if (isset($passed_ent_id)) {
  398.             $link .= '&amp;passed_ent_id='.$passed_ent_id;
  399.         }
  400.  
  401.         // Always add the link for downloading the mail as a file to the global
  402.         // variable.
  403.         $download_and_unsafe_link .= '&nbsp;| <a href="download.php?absolute_dl=true&amp;' .
  404.             $link '" style="white-space: nowrap;">' _("Download this as a file".  '</a>';
  405.  
  406.         // Find out the right text to use in the link depending on the
  407.         // circumstances. If the unsafe images are displayed the link should
  408.         // hide them, if they aren't displayed the link should only appear if
  409.         // the mail really contains unsafe images.
  410.         if ($view_unsafe_images{
  411.             $text _("Hide Unsafe Images");
  412.         else {
  413.             if (isset($has_unsafe_images&& $has_unsafe_images{
  414.                 $link .= '&amp;view_unsafe_images=1';
  415.                 $text _("View Unsafe Images");
  416.             else {
  417.                 $text '';
  418.             }
  419.         }
  420.  
  421.         // Only create a link for unsafe images if there's need for one. If so:
  422.         // add it to the global variable.
  423.         if($text != ''{
  424.             $download_and_unsafe_link .= '&nbsp;| <a href="read_body.php?' $link '" style="white-space: nowrap;">' $text '</a>';
  425.         }
  426.     }
  427.     return $body;
  428. }
  429.  
  430.  
  431. function formatAttachments($message$exclude_id$mailbox$id{
  432.     global $where$what$startMessage$color$passed_ent_id$block_svg_download;
  433.     static $ShownHTML 0;
  434.  
  435.     $att_ar $message->getAttachments($exclude_id);
  436.  
  437.     if (!count($att_ar)) return '';
  438.  
  439.     $attachments '';
  440.  
  441.     $urlMailbox urlencode($mailbox);
  442.  
  443.     foreach ($att_ar as $att{
  444.         $ent $att->entity_id;
  445.         $header $att->header;
  446.         $type0 strtolower($header->type0);
  447.         $type1 strtolower($header->type1);
  448.         if ($block_svg_download && strpos($type1'svg'=== 0)
  449.             continue;
  450.  
  451.         $name '';
  452.         $links['download link']['text'_("Download");
  453.         $links['download link']['href'SM_PATH .
  454.             "src/download.php?absolute_dl=true&amp;passed_id=$id&amp;mailbox=$urlMailbox&amp;ent_id=$ent";
  455.         $ImageURL '';
  456.         if ($type0 =='message' && $type1 == 'rfc822'{
  457.             $default_page SM_PATH 'src/read_body.php';
  458.             $rfc822_header $att->rfc822_header;
  459.             $filename $rfc822_header->subject;
  460.             if (trim$filename == ''{
  461.                 $filename 'untitled-[' $ent ']' ;
  462.             }
  463.             $from_o $rfc822_header->from;
  464.             if (is_object($from_o)) {
  465.                 $from_name $from_o->getAddress(false);
  466.             elseif (is_array($from_o&& count($from_o&& is_object($from_o[0])) {
  467.                 // when a digest message is opened and you return to the digest
  468.                 // now the from object is part of an array. This is a workaround.
  469.                 $from_name $from_o[0]->getAddress(false);
  470.             else {
  471.                 $from_name _("Unknown sender");
  472.             }
  473.             $from_name decodeHeader(($from_name));
  474.             $description $from_name;
  475.         else {
  476.             $default_page SM_PATH 'src/download.php';
  477.             if (is_object($header->disposition)) {
  478.                 $filename $header->disposition->getProperty('filename');
  479.                 if (trim($filename== ''{
  480.                     $name decodeHeader($header->disposition->getProperty('name'));
  481.                     if (trim($name== ''{
  482.                         $name $header->getParameter('name');
  483.                         if(trim($name== ''{
  484.                             if (trim$header->id == ''{
  485.                                 $filename 'untitled-[' $ent ']' '.' strtolower($header->type1);
  486.                             else {
  487.                                 $filename 'cid: ' $header->id '.' strtolower($header->type1);
  488.                             }
  489.                         else {
  490.                             $filename $name;
  491.                         }
  492.                     else {
  493.                         $filename $name;
  494.                     }
  495.                 }
  496.             else {
  497.                 $filename $header->getParameter('name');
  498.                 if (!trim($filename)) {
  499.                     if (trim$header->id == ''{
  500.                         $filename 'untitled-[' $ent ']' '.' strtolower($header->type1;
  501.                     else {
  502.                         $filename 'cid: ' $header->id '.' strtolower($header->type1);
  503.                     }
  504.                 }
  505.             }
  506.             if ($header->description{
  507.                 $description decodeHeader($header->description);
  508.             else {
  509.                 $description '';
  510.             }
  511.         }
  512.  
  513.         $display_filename $filename;
  514.         if (isset($passed_ent_id)) {
  515.             $passed_ent_id_link '&amp;passed_ent_id='.$passed_ent_id;
  516.         else {
  517.             $passed_ent_id_link '';
  518.         }
  519.         $defaultlink $default_page "?startMessage=$startMessage"
  520.             . "&amp;passed_id=$id&amp;mailbox=$urlMailbox"
  521.             . '&amp;ent_id='.$ent.$passed_ent_id_link;
  522.         if ($where && $what{
  523.            $defaultlink .= '&amp;where='urlencode($where).'&amp;what='.urlencode($what);
  524.         }
  525.         // IE does make use of mime content sniffing. Forcing a download
  526.         // prohibit execution of XSS inside an application/octet-stream attachment
  527.         if ($type0 == 'application' && $type1 == 'octet-stream'{
  528.             $defaultlink .= '&amp;absolute_dl=true';
  529.         }
  530.         /* This executes the attachment hook with a specific MIME-type.
  531.          * If that doesn't have results, it tries if there's a rule
  532.          * for a more generic type. Finally, a hook for ALL attachment
  533.          * types is run as well.
  534.          */
  535.         $hookresults do_hook("attachment $type0/$type1"$links,
  536.                 $startMessage$id$urlMailbox$ent$defaultlink,
  537.                 $display_filename$where$what);
  538.         $hookresults do_hook("attachment $type0/*"$hookresults[1],
  539.                 $startMessage$id$urlMailbox$ent$hookresults[6],
  540.                 $display_filename$where$what);
  541.         $hookresults do_hook("attachment */*"$hookresults[1],
  542.                 $startMessage$id$urlMailbox$ent$hookresults[6],
  543.                 $display_filename$where$what);
  544.  
  545.         $links $hookresults[1];
  546.         $defaultlink $hookresults[6];
  547.  
  548.         $attachments .= '<tr><td>' .
  549.             '<a href="'.$defaultlink.'">'.decodeHeader($display_filename).'</a>&nbsp;</td>' .
  550.             '<td><small><b>' show_readable_size($header->size.
  551.             '</b>&nbsp;&nbsp;</small></td>' .
  552.             '<td><small>[ '.sm_encode_html_special_chars($type0).'/'.sm_encode_html_special_chars($type1).' ]&nbsp;</small></td>' .
  553.             '<td><small>';
  554.         $attachments .= '<b>' $description '</b>';
  555.         $attachments .= '</small></td><td><small>&nbsp;';
  556.  
  557.         $skipspaces 1;
  558.         foreach ($links as $val{
  559.             if ($skipspaces{
  560.                 $skipspaces 0;
  561.             else {
  562.                 $attachments .= '&nbsp;&nbsp;|&nbsp;&nbsp;';
  563.             }
  564.             $attachments .= '<a href="' $val['href''">' .  $val['text''</a>';
  565.         }
  566.         unset($links);
  567.         $attachments .= "</td></tr>\n";
  568.     }
  569.     return $attachments;
  570. }
  571.  
  572. function sqimap_base64_decode(&$string{
  573.  
  574.     // Base64 encoded data goes in pairs of 4 bytes. To achieve on the
  575.     // fly decoding (to reduce memory usage) you have to check if the
  576.     // data has incomplete pairs
  577.  
  578.     // Remove the noise in order to check if the 4 bytes pairs are complete
  579.     $string str_replace(array("\r\n","\n""\r"" "),array('','','',''),$string);
  580.  
  581.     $sStringRem '';
  582.     $iMod strlen($string4;
  583.     if ($iMod{
  584.         $sStringRem substr($string,-$iMod);
  585.         // Check if $sStringRem contains padding characters
  586.         if (substr($sStringRem,-1!= '='{
  587.             $string substr($string,0,-$iMod);
  588.         else {
  589.             $sStringRem '';
  590.         }
  591.     }
  592.     $string base64_decode($string);
  593.     return $sStringRem;
  594. }
  595.  
  596. /**
  597.  * Decodes encoded message body
  598.  *
  599.  * This function decodes the body depending on the encoding type.
  600.  * Currently quoted-printable and base64 encodings are supported.
  601.  * decode_body hook was added to this function in 1.4.2/1.5.0
  602.  * @param string $body encoded message body
  603.  * @param string $encoding used encoding
  604.  * @return string decoded string
  605.  * @since 1.0
  606.  */
  607. function decodeBody($body$encoding{
  608.  
  609.     $body str_replace("\r\n""\n"$body);
  610.     $encoding strtolower($encoding);
  611.  
  612.     $encoding_handler do_hook_function('decode_body'$encoding);
  613.  
  614.     // plugins get first shot at decoding the body
  615.     if (!empty($encoding_handler&& function_exists($encoding_handler)) {
  616.         $body $encoding_handler('decode'$body);
  617.  
  618.     elseif ($encoding == 'quoted-printable' ||
  619.             $encoding == 'quoted_printable'{
  620.         /**
  621.          * quoted_printable_decode() function is broken in older
  622.          * php versions. Text with \r\n decoding was fixed only
  623.          * in php 4.3.0. Minimal code requirement 4.0.4 +
  624.          * str_replace("\r\n", "\n", $body); call.
  625.          */
  626.         $body quoted_printable_decode($body);
  627.     elseif ($encoding == 'base64'{
  628.         $body base64_decode($body);
  629.     }
  630.  
  631.     // All other encodings are returned raw.
  632.     return $body;
  633. }
  634.  
  635. /**
  636.  * Decodes headers
  637.  *
  638.  * This functions decode strings that is encoded according to
  639.  * RFC1522 (MIME Part Two: Message Header Extensions for Non-ASCII Text).
  640.  * Patched by Christian Schmidt <[email protected]>  23/03/2002
  641.  */
  642. function decodeHeader ($string$utfencode=true,$htmlsave=true,$decide=false{
  643.     global $languages$squirrelmail_language,$default_charset$fix_broken_base64_encoded_messages;
  644.     if (is_array($string)) {
  645.         $string implode("\n"$string);
  646.     }
  647.  
  648.     if (isset($languages[$squirrelmail_language]['XTRA_CODE']&&
  649.             function_exists($languages[$squirrelmail_language]['XTRA_CODE'])) {
  650.         $string $languages[$squirrelmail_language]['XTRA_CODE']('decodeheader'$string);
  651.         // Do we need to return at this point?
  652.         // return $string;
  653.     }
  654.     $i 0;
  655.     $iLastMatch = -2;
  656.     $encoded false;
  657.  
  658. // FIXME: spaces are allowed inside quoted-printable encoding, but the following line will bust up any such encoded strings
  659.     $aString explode(' ',$string);
  660.     $ret '';
  661.     foreach ($aString as $chunk{
  662.         if ($encoded && $chunk === ''{
  663.             continue;
  664.         elseif ($chunk === ''{
  665.             $ret .= ' ';
  666.             continue;
  667.         }
  668.         $encoded false;
  669.         /* if encoded words are not separated by a linear-space-white we still catch them */
  670.         $j $i-1;
  671.  
  672.         while ($match preg_match('/^(.*)=\?([^?]*)\?(Q|B)\?([^?]*)\?=(.*)$/Ui',$chunk,$res)) {
  673.             /* if the last chunk isn't an encoded string then put back the space, otherwise don't */
  674.             if ($iLastMatch !== $j{
  675.                 if ($htmlsave{
  676.                     $ret .= '&#32;';
  677.                 else {
  678.                     $ret .= ' ';
  679.                 }
  680.             }
  681.             $iLastMatch $i;
  682.             $j $i;
  683.             if ($htmlsave{
  684.                 $ret .= sm_encode_html_special_chars($res[1]);
  685.             else {
  686.                 $ret .= $res[1];
  687.             }
  688.             $encoding ucfirst($res[3]);
  689.  
  690.             /* decide about valid decoding */
  691.             if ($decide && is_conversion_safe($res[2])) {
  692.                 $can_be_encoded=true;
  693.             else {
  694.                 $can_be_encoded=false;
  695.             }
  696.  
  697.             switch ($encoding)
  698.             {
  699.                 case 'B':
  700.                     // fix broken base64-encoded strings (remove end = padding,
  701.                     // change any = to + in middle of string, add padding back
  702.                     // to the end)
  703.                     if ($fix_broken_base64_encoded_messages{
  704.                         $encoded_string_minus_padding strtr(rtrim($res[4]'=')'=''+');
  705.                         $res[4str_pad($encoded_string_minus_paddingstrlen($res[4])'=');
  706.                     }
  707.                     $replace base64_decode($res[4]);
  708.                     if ($can_be_encoded{
  709.                         // string is converted from one charset to another. sanitizing depends on $htmlsave
  710.                         $replace =  charset_convert($res[2],$replace,$default_charset,$htmlsave);
  711.                     elseif ($utfencode{
  712.                         // string is converted to htmlentities and sanitized
  713.                         $replace charset_decode($res[2],$replace);
  714.                     elseif ($htmlsave{
  715.                         // string is not converted, but still sanitized
  716.                         $replace sm_encode_html_special_chars($replace);
  717.                     }
  718.                     $ret.= $replace;
  719.                     break;
  720.                 case 'Q':
  721.                     $replace str_replace('_'' '$res[4]);
  722.                     $replace preg_replace_callback('/=([0-9a-f]{2})/i',
  723.                             create_function ('$matches''return chr(hexdec($matches[1]));'),
  724.                             $replace);
  725.                     if ($can_be_encoded{
  726.                         // string is converted from one charset to another. sanitizing depends on $htmlsave
  727.                         $replace charset_convert($res[2]$replace,$default_charset,$htmlsave);
  728.                     elseif ($utfencode{
  729.                         // string is converted to html entities and sanitized
  730.                         $replace charset_decode($res[2]$replace);
  731.                     elseif ($htmlsave{
  732.                         // string is not converted, but still sanizited
  733.                         $replace sm_encode_html_special_chars($replace);
  734.                     }
  735.                     $ret .= $replace;
  736.                     break;
  737.                 default:
  738.                     break;
  739.             }
  740.             $chunk $res[5];
  741.             $encoded true;
  742.         }
  743.         if (!$encoded{
  744.             if ($htmlsave{
  745.                 $ret .= '&#32;';
  746.             else {
  747.                 $ret .= ' ';
  748.             }
  749.         }
  750.  
  751.         if (!$encoded && $htmlsave{
  752.             $ret .= sm_encode_html_special_chars($chunk);
  753.         else {
  754.             $ret .= $chunk;
  755.         }
  756.         ++$i;
  757.     }
  758.     /* remove the first added space */
  759.     if ($ret{
  760.         if ($htmlsave{
  761.             $ret substr($ret,5);
  762.         else {
  763.             $ret substr($ret,1);
  764.         }
  765.     }
  766.  
  767.     return $ret;
  768. }
  769.  
  770. /**
  771.  * Encodes header as quoted-printable
  772.  *
  773.  * Encode a string according to RFC 1522 for use in headers if it
  774.  * contains 8-bit characters or anything that looks like it should
  775.  * be encoded.
  776.  */
  777. function encodeHeader ($string{
  778.     global $default_charset$languages$squirrelmail_language;
  779.  
  780.     if (isset($languages[$squirrelmail_language]['XTRA_CODE']&&
  781.             function_exists($languages[$squirrelmail_language]['XTRA_CODE'])) {
  782.         return  $languages[$squirrelmail_language]['XTRA_CODE']('encodeheader'$string);
  783.     }
  784.  
  785.     // Use B encoding for multibyte charsets
  786.     $mb_charsets array('utf-8','big5','gb2313','euc-kr');
  787.     if (in_array($default_charset,$mb_charsets&&
  788.         in_array($default_charset,sq_mb_list_encodings()) &&
  789.         sq_is8bit($string)) {
  790.         return encodeHeaderBase64($string,$default_charset);
  791.     elseif (in_array($default_charset,$mb_charsets&&
  792.               sq_is8bit($string&&
  793.               in_array($default_charset,sq_mb_list_encodings())) {
  794.         // Add E_USER_NOTICE error here (can cause 'Cannot add header information' warning in compose.php)
  795.         // trigger_error('encodeHeader: Multibyte character set unsupported by mbstring extension.',E_USER_NOTICE);
  796.     }
  797.  
  798.     // Encode only if the string contains 8-bit characters or =?
  799.     $j strlen($string);
  800.     $max_l 75 strlen($default_charset7;
  801.     $aRet array();
  802.     $ret '';
  803.     $iEncStart $enc_init false;
  804.     $cur_l $iOffset 0;
  805.     for($i 0$i $j++$i{
  806.         switch($string{$i})
  807.         {
  808.             case '"':
  809.             case '=':
  810.             case '<':
  811.             case '>':
  812.             case ',':
  813.             case '?':
  814.             case '_':
  815.                 if ($iEncStart === false{
  816.                     $iEncStart $i;
  817.                 }
  818.                 $cur_l+=3;
  819.                 if ($cur_l ($max_l-2)) {
  820.                     /* if there is an stringpart that doesn't need encoding, add it */
  821.                     $aRet[substr($string,$iOffset,$iEncStart-$iOffset);
  822.                     $aRet["=?$default_charset?Q?$ret?=";
  823.                     $iOffset $i;
  824.                     $cur_l 0;
  825.                     $ret '';
  826.                     $iEncStart false;
  827.                 else {
  828.                     $ret .= sprintf("=%02X",ord($string{$i}));
  829.                 }
  830.                 break;
  831.             case '(':
  832.             case ')':
  833.                 if ($iEncStart !== false{
  834.                     $aRet[substr($string,$iOffset,$iEncStart-$iOffset);
  835.                     $aRet["=?$default_charset?Q?$ret?=";
  836.                     $iOffset $i;
  837.                     $cur_l 0;
  838.                     $ret '';
  839.                     $iEncStart false;
  840.                 }
  841.                 break;
  842.             case ' ':
  843.                 if ($iEncStart !== false{
  844.                     $cur_l++;
  845.                     if ($cur_l $max_l{
  846.                         $aRet[substr($string,$iOffset,$iEncStart-$iOffset);
  847.                         $aRet["=?$default_charset?Q?$ret?=";
  848.                         $iOffset $i;
  849.                         $cur_l 0;
  850.                         $ret '';
  851.                         $iEncStart false;
  852.                     else {
  853.                         $ret .= '_';
  854.                     }
  855.                 }
  856.                 break;
  857.             default:
  858.                 $k ord($string{$i});
  859.                 if ($k 126{
  860.                     if ($iEncStart === false{
  861.                         // do not start encoding in the middle of a string, also take the rest of the word.
  862.                         $sLeadString substr($string,0,$i);
  863.                         $aLeadString explode(' ',$sLeadString);
  864.                         $sToBeEncoded array_pop($aLeadString);
  865.                         $iEncStart $i strlen($sToBeEncoded);
  866.                         $ret .= $sToBeEncoded;
  867.                         $cur_l += strlen($sToBeEncoded);
  868.                     }
  869.                     $cur_l += 3;
  870.                     /* first we add the encoded string that reached it's max size */
  871.                     if ($cur_l ($max_l-2)) {
  872.                         $aRet[substr($string,$iOffset,$iEncStart-$iOffset);
  873.                         $aRet["=?$default_charset?Q?$ret?= "/* the next part is also encoded => separate by space */
  874.                         $cur_l 3;
  875.                         $ret '';
  876.                         $iOffset $i;
  877.                         $iEncStart $i;
  878.                     }
  879.                     $enc_init true;
  880.                     $ret .= sprintf("=%02X"$k);
  881.                 else {
  882.                     if ($iEncStart !== false{
  883.                         $cur_l++;
  884.                         if ($cur_l $max_l{
  885.                             $aRet[substr($string,$iOffset,$iEncStart-$iOffset);
  886.                             $aRet["=?$default_charset?Q?$ret?=";
  887.                             $iEncStart false;
  888.                             $iOffset $i;
  889.                             $cur_l 0;
  890.                             $ret '';
  891.                         else {
  892.                             $ret .= $string{$i};
  893.                         }
  894.                     }
  895.                 }
  896.                 break;
  897.         }
  898.     }
  899.  
  900.     if ($enc_init{
  901.         if ($iEncStart !== false{
  902.             $aRet[substr($string,$iOffset,$iEncStart-$iOffset);
  903.             $aRet["=?$default_charset?Q?$ret?=";
  904.         else {
  905.             $aRet[substr($string,$iOffset);
  906.         }
  907.         $string implode('',$aRet);
  908.     }
  909.     return $string;
  910. }
  911.  
  912. /**
  913.  * Encodes string according to rfc2047 B encoding header formating rules
  914.  *
  915.  * It is recommended way to encode headers with character sets that store
  916.  * symbols in more than one byte.
  917.  *
  918.  * Function requires mbstring support. If required mbstring functions are missing,
  919.  * function returns false and sets E_USER_WARNING level error message.
  920.  *
  921.  * Minimal requirements - php 4.0.6 with mbstring extension. Please note,
  922.  * that mbstring functions will generate E_WARNING errors, if unsupported
  923.  * character set is used. mb_encode_mimeheader function provided by php
  924.  * mbstring extension is not used in order to get better control of header
  925.  * encoding.
  926.  *
  927.  * Used php code functions - function_exists(), trigger_error(), strlen()
  928.  * (is used with charset names and base64 strings). Used php mbstring
  929.  * functions - mb_strlen and mb_substr.
  930.  *
  931.  * Related documents: rfc 2045 (BASE64 encoding), rfc 2047 (mime header
  932.  * encoding), rfc 2822 (header folding)
  933.  *
  934.  * @param string $string header string that must be encoded
  935.  * @param string $charset character set. Must be supported by mbstring extension.
  936.  *  Use sq_mb_list_encodings() to detect supported charsets.
  937.  * @return string string encoded according to rfc2047 B encoding formating rules
  938.  * @since 1.5.1 and 1.4.6
  939.  */
  940. function encodeHeaderBase64($string,$charset{
  941.     /**
  942.      * Check mbstring function requirements.
  943.      */
  944.     if (function_exists('mb_strlen'||
  945.         function_exists('mb_substr')) {
  946.         // set E_USER_WARNING
  947.         trigger_error('encodeHeaderBase64: Required mbstring functions are missing.',E_USER_WARNING);
  948.         // return false
  949.         return false;
  950.     }
  951.  
  952.     // initial return array
  953.     $aRet array();
  954.  
  955.     /**
  956.      * header length = 75 symbols max (same as in encodeHeader)
  957.      * remove $charset length
  958.      * remove =? ? ?= (5 chars)
  959.      * remove 2 more chars (\r\n ?)
  960.      */
  961.     $iMaxLength 75 strlen($charset7;
  962.  
  963.     // set first character position
  964.     $iStartCharNum 0;
  965.  
  966.     // loop through all characters. count characters and not bytes.
  967.     for ($iCharNum=1$iCharNum<=mb_strlen($string,$charset)$iCharNum++{
  968.         // encode string from starting character to current character.
  969.         $encoded_string base64_encode(mb_substr($string,$iStartCharNum,$iCharNum-$iStartCharNum,$charset));
  970.  
  971.         // Check encoded string length
  972.         if(strlen($encoded_string)>$iMaxLength{
  973.             // if string exceeds max length, reduce number of encoded characters and add encoded string part to array
  974.             $aRet[base64_encode(mb_substr($string,$iStartCharNum,$iCharNum-$iStartCharNum-1,$charset));
  975.  
  976.             // set new starting character
  977.             $iStartCharNum $iCharNum-1;
  978.  
  979.             // encode last char (in case it is last character in string)
  980.             $encoded_string base64_encode(mb_substr($string,$iStartCharNum,$iCharNum-$iStartCharNum,$charset));
  981.         // if string is shorter than max length - add next character
  982.     }
  983.  
  984.     // add last encoded string to array
  985.     $aRet[$encoded_string;
  986.  
  987.     // set initial return string
  988.     $sRet '';
  989.  
  990.     // loop through encoded strings
  991.     foreach($aRet as $string{
  992.         // TODO: Do we want to control EOL (end-of-line) marker
  993.         if ($sRet!=''$sRet.= " ";
  994.  
  995.         // add header tags and encoded string to return string
  996.         $sRet.= '=?'.$charset.'?B?'.$string.'?=';
  997.     }
  998.  
  999.     return $sRet;
  1000. }
  1001.  
  1002. /* This function trys to locate the entity_id of a specific mime element */
  1003. function find_ent_id($id$message{
  1004.     for ($i 0$ret ''$ret == '' && $i count($message->entities)$i++{
  1005.         if ($message->entities[$i]->header->type0 == 'multipart')  {
  1006.             $ret find_ent_id($id$message->entities[$i]);
  1007.         else {
  1008.             if (strcasecmp($message->entities[$i]->header->id$id== 0{
  1009. //                if (sq_check_save_extension($message->entities[$i])) {
  1010.                 return $message->entities[$i]->entity_id;
  1011. //                }
  1012.             elseif (!empty($message->entities[$i]->header->parameters['name'])) {
  1013.                 /**
  1014.                  * This is part of a fix for Outlook Express 6.x generating
  1015.                  * cid URLs without creating content-id headers
  1016.                  * @@JA - 20050207
  1017.                  */
  1018.                 if (strcasecmp($message->entities[$i]->header->parameters['name']$id== 0{
  1019.                     return $message->entities[$i]->entity_id;
  1020.                 }
  1021.             }
  1022.         }
  1023.     }
  1024.     return $ret;
  1025. }
  1026.  
  1027. function sq_check_save_extension($message{
  1028.     $filename $message->getFilename();
  1029.     $ext substr($filenamestrrpos($filename,'.')+1);
  1030.     $save_extensions array('jpg','jpeg','gif','png','bmp');
  1031.     return in_array($ext$save_extensions);
  1032. }
  1033.  
  1034.  
  1035. /**
  1036.  ** HTMLFILTER ROUTINES
  1037.  */
  1038.  
  1039. /**
  1040.  * This function checks attribute values for entity-encoded values
  1041.  * and returns them translated into 8-bit strings so we can run
  1042.  * checks on them.
  1043.  *
  1044.  * @param  $attvalue A string to run entity check against.
  1045.  * @return           Nothing, modifies a reference value.
  1046.  */
  1047. function sq_defang(&$attvalue){
  1048.     $me 'sq_defang';
  1049.     /**
  1050.      * Skip this if there aren't ampersands or backslashes.
  1051.      */
  1052.     if (strpos($attvalue'&'=== false
  1053.         && strpos($attvalue'\\'=== false){
  1054.         return;
  1055.     }
  1056.     $m false;
  1057.     do {
  1058.         $m false;
  1059.         $m $m || sq_deent($attvalue'/\&#0*(\d+);*/s');
  1060.         $m $m || sq_deent($attvalue'/\&#x0*((\d|[a-f])+);*/si'true);
  1061.         $m $m || sq_deent($attvalue'/\\\\(\d+)/s'true);
  1062.     while ($m == true);
  1063.     $attvalue stripslashes($attvalue);
  1064. }
  1065.  
  1066. /**
  1067.  * Kill any tabs, newlines, or carriage returns. Our friends the
  1068.  * makers of the browser with 95% market value decided that it'd
  1069.  * be funny to make "java[tab]script" be just as good as "javascript".
  1070.  *
  1071.  * @param  attvalue  The attribute value before extraneous spaces removed.
  1072.  * @return attvalue  Nothing, modifies a reference value.
  1073.  */
  1074. function sq_unspace(&$attvalue){
  1075.     $me 'sq_unspace';
  1076.     if (strcspn($attvalue"\t\r\n\0 "!= strlen($attvalue)){
  1077.         $attvalue str_replace(Array("\t""\r""\n""\0"" "),
  1078.                                 Array('',   '',   '',   '',   '')$attvalue);
  1079.     }
  1080. }
  1081.  
  1082. /**
  1083.  * Translate all dangerous Unicode or Shift_JIS characters which are accepted by
  1084.  * IE as regular characters.
  1085.  *
  1086.  * @param  attvalue  The attribute value before dangerous characters are translated.
  1087.  * @return attvalue  Nothing, modifies a reference value.
  1088.  * @author Marc Groot Koerkamp.
  1089.  */
  1090. function sq_fixIE_idiocy(&$attvalue{
  1091.     // remove NUL
  1092.     $attvalue str_replace("\0"""$attvalue);
  1093.     // remove comments
  1094.     $attvalue preg_replace("/(\/\*.*?\*\/)/","",$attvalue);
  1095.  
  1096.     // IE has the evil habit of accepting every possible value for the attribute expression.
  1097.     // The table below contains characters which are parsed by IE if they are used in the "expression"
  1098.     // attribute value.
  1099.     $aDangerousCharsReplacementTable array(
  1100.                         array('&#x029F;''&#0671;' ,/* L UNICODE IPA Extension */
  1101.                               '&#x0280;''&#0640;' ,/* R UNICODE IPA Extension */
  1102.                               '&#x0274;''&#0628;' ,/* N UNICODE IPA Extension */
  1103.                               '&#xFF25;''&#65317;' ,/* Unicode FULLWIDTH LATIN CAPITAL LETTER E */
  1104.                               '&#xFF45;''&#65349;' ,/* Unicode FULLWIDTH LATIN SMALL LETTER E */
  1105.                               '&#xFF38;''&#65336;',/* Unicode FULLWIDTH LATIN CAPITAL LETTER X */
  1106.                               '&#xFF58;''&#65368;',/* Unicode FULLWIDTH LATIN SMALL LETTER X */
  1107.                               '&#xFF30;''&#65328;',/* Unicode FULLWIDTH LATIN CAPITAL LETTER P */
  1108.                               '&#xFF50;''&#65360;',/* Unicode FULLWIDTH LATIN SMALL LETTER P */
  1109.                               '&#xFF32;''&#65330;',/* Unicode FULLWIDTH LATIN CAPITAL LETTER R */
  1110.                               '&#xFF52;''&#65362;',/* Unicode FULLWIDTH LATIN SMALL LETTER R */
  1111.                               '&#xFF33;''&#65331;',/* Unicode FULLWIDTH LATIN CAPITAL LETTER S */
  1112.                               '&#xFF53;''&#65363;',/* Unicode FULLWIDTH LATIN SMALL LETTER S */
  1113.                               '&#xFF29;''&#65321;',/* Unicode FULLWIDTH LATIN CAPITAL LETTER I */
  1114.                               '&#xFF49;''&#65353;',/* Unicode FULLWIDTH LATIN SMALL LETTER I */
  1115.                               '&#xFF2F;''&#65327;',/* Unicode FULLWIDTH LATIN CAPITAL LETTER O */
  1116.                               '&#xFF4F;''&#65359;',/* Unicode FULLWIDTH LATIN SMALL LETTER O */
  1117.                               '&#xFF2E;''&#65326;',/* Unicode FULLWIDTH LATIN CAPITAL LETTER N */
  1118.                               '&#xFF4E;''&#65358;',/* Unicode FULLWIDTH LATIN SMALL LETTER N */
  1119.                               '&#xFF2C;''&#65324;',/* Unicode FULLWIDTH LATIN CAPITAL LETTER L */
  1120.                               '&#xFF4C;''&#65356;',/* Unicode FULLWIDTH LATIN SMALL LETTER L */
  1121.                               '&#xFF35;''&#65333;',/* Unicode FULLWIDTH LATIN CAPITAL LETTER U */
  1122.                               '&#xFF55;''&#65365;',/* Unicode FULLWIDTH LATIN SMALL LETTER U */
  1123.                               '&#x207F;''&#8319;' ,/* Unicode SUPERSCRIPT LATIN SMALL LETTER N */
  1124.                               "\xEF\xBC\xA5"/* Shift JIS FULLWIDTH LATIN CAPITAL LETTER E */   // in unicode this is some Chinese char range
  1125.                               "\xEF\xBD\x85"/* Shift JIS FULLWIDTH LATIN SMALL LETTER E */
  1126.                               "\xEF\xBC\xB8"/* Shift JIS FULLWIDTH LATIN CAPITAL LETTER X */
  1127.                               "\xEF\xBD\x98"/* Shift JIS FULLWIDTH LATIN SMALL LETTER X */
  1128.                               "\xEF\xBC\xB0"/* Shift JIS FULLWIDTH LATIN CAPITAL LETTER P */
  1129.                               "\xEF\xBD\x90"/* Shift JIS FULLWIDTH LATIN SMALL LETTER P */
  1130.                               "\xEF\xBC\xB2"/* Shift JIS FULLWIDTH LATIN CAPITAL LETTER R */
  1131.                               "\xEF\xBD\x92"/* Shift JIS FULLWIDTH LATIN SMALL LETTER R */
  1132.                               "\xEF\xBC\xB3"/* Shift JIS FULLWIDTH LATIN CAPITAL LETTER S */
  1133.                               "\xEF\xBD\x93"/* Shift JIS FULLWIDTH LATIN SMALL LETTER S */
  1134.                               "\xEF\xBC\xA9"/* Shift JIS FULLWIDTH LATIN CAPITAL LETTER I */
  1135.                               "\xEF\xBD\x89"/* Shift JIS FULLWIDTH LATIN SMALL LETTER I */
  1136.                               "\xEF\xBC\xAF"/* Shift JIS FULLWIDTH LATIN CAPITAL LETTER O */
  1137.                               "\xEF\xBD\x8F"/* Shift JIS FULLWIDTH LATIN SMALL LETTER O */
  1138.                               "\xEF\xBC\xAE"/* Shift JIS FULLWIDTH LATIN CAPITAL LETTER N */
  1139.                               "\xEF\xBD\x8E"/* Shift JIS FULLWIDTH LATIN SMALL LETTER N */
  1140.                               "\xEF\xBC\xAC"/* Shift JIS FULLWIDTH LATIN CAPITAL LETTER L */
  1141.                               "\xEF\xBD\x8C"/* Shift JIS FULLWIDTH LATIN SMALL LETTER L */
  1142.                               "\xEF\xBC\xB5"/* Shift JIS FULLWIDTH LATIN CAPITAL LETTER U */
  1143.                               "\xEF\xBD\x95"/* Shift JIS FULLWIDTH LATIN SMALL LETTER U */
  1144.                               "\xE2\x81\xBF"/* Shift JIS FULLWIDTH SUPERSCRIPT N */
  1145.                               "\xCA\x9F"/* L UNICODE IPA Extension */
  1146.                               "\xCA\x80"/* R UNICODE IPA Extension */
  1147.                               "\xC9\xB4"),  /* N UNICODE IPA Extension */
  1148.                        array('l''l''r','r','n','n',
  1149.                              'E','E','e','e','X','X','x','x','P','P','p','p','R','R','r','r','S','S','s','s','I','I',
  1150.                              'i','i','O','O','o','o','N','N','n','n','L','L','l','l','U','U','u','u','n','n',
  1151.                              'E','e','X','x','P','p','R','r','S','s','I','i','O','o','N','n','L','l','U','u','n','l','r','n'));
  1152.     $attvalue str_replace($aDangerousCharsReplacementTable[0],$aDangerousCharsReplacementTable[1],$attvalue);
  1153.  
  1154.     // Escapes are useful for special characters like "{}[]()'&. In other cases they are
  1155.     // used for XSS.
  1156.     $attvalue preg_replace("/(\\\\)([a-zA-Z]{1})/",'$2',$attvalue);
  1157. }
  1158.  
  1159. /**
  1160.  * This function returns the final tag out of the tag name, an array
  1161.  * of attributes, and the type of the tag. This function is called by
  1162.  * sq_sanitize internally.
  1163.  *
  1164.  * @param  $tagname  the name of the tag.
  1165.  * @param  $attary   the array of attributes and their values
  1166.  * @param  $tagtype  The type of the tag (see in comments).
  1167.  * @return           string with the final tag representation.
  1168.  */
  1169. function sq_tagprint($tagname$attary$tagtype){
  1170.     $me 'sq_tagprint';
  1171.  
  1172.     if ($tagtype == 2){
  1173.         $fulltag '</' $tagname '>';
  1174.     else {
  1175.         $fulltag '<' $tagname;
  1176.         if (is_array($attary&& sizeof($attary)){
  1177.             $atts Array();
  1178.             while (list($attname$attvalueeach($attary)){
  1179.                 array_push($atts"$attname=$attvalue");
  1180.             }
  1181.             $fulltag .= ' ' join(" "$atts);
  1182.         }
  1183.         if ($tagtype == 3){
  1184.             $fulltag .= ' /';
  1185.         }
  1186.         $fulltag .= '>';
  1187.     }
  1188.     return $fulltag;
  1189. }
  1190.  
  1191. /**
  1192.  * A small helper function to use with array_walk. Modifies a by-ref
  1193.  * value and makes it lowercase.
  1194.  *
  1195.  * @param  $val a value passed by-ref.
  1196.  * @return      void since it modifies a by-ref value.
  1197.  */
  1198. function sq_casenormalize(&$val){
  1199.     $val strtolower($val);
  1200. }
  1201.  
  1202. /**
  1203.  * This function skips any whitespace from the current position within
  1204.  * a string and to the next non-whitespace value.
  1205.  *
  1206.  * @param  $body   the string
  1207.  * @param  $offset the offset within the string where we should start
  1208.  *                  looking for the next non-whitespace character.
  1209.  * @return         the location within the $body where the next
  1210.  *                  non-whitespace char is located.
  1211.  */
  1212. function sq_skipspace($body$offset){
  1213.     $me 'sq_skipspace';
  1214.     preg_match('/^(\s*)/s'substr($body$offset)$matches);
  1215.     if (!empty($matches[1])){
  1216.         $offset += strlen($matches[1]);
  1217.     }
  1218.     return $offset;
  1219. }
  1220.  
  1221. /**
  1222.  * This function looks for the next character within a string.  It's
  1223.  * really just a glorified "strpos", except it catches if failures
  1224.  * nicely.
  1225.  *
  1226.  * @param  $body   The string to look for needle in.
  1227.  * @param  $offset Start looking from this position.
  1228.  * @param  $needle The character/string to look for.
  1229.  * @return         location of the next occurance of the needle, or
  1230.  *                  strlen($body) if needle wasn't found.
  1231.  */
  1232. function sq_findnxstr($body$offset$needle){
  1233.     $me  'sq_findnxstr';
  1234.     $pos strpos($body$needle$offset);
  1235.     if ($pos === FALSE){
  1236.         $pos strlen($body);
  1237.     }
  1238.     return $pos;
  1239. }
  1240.  
  1241. /**
  1242.  * This function takes a PCRE-style regexp and tries to match it
  1243.  * within the string.
  1244.  *
  1245.  * @param  $body   The string to look for needle in.
  1246.  * @param  $offset Start looking from here.
  1247.  * @param  $reg    A PCRE-style regex to match.
  1248.  * @return         Returns a false if no matches found, or an array
  1249.  *                  with the following members:
  1250.  *                  - integer with the location of the match within $body
  1251.  *                  - string with whatever content between offset and the match
  1252.  *                  - string with whatever it is we matched
  1253.  */
  1254. function sq_findnxreg($body$offset$reg){
  1255.     $me 'sq_findnxreg';
  1256.     $matches Array();
  1257.     $retarr Array();
  1258.     preg_match("%^(.*?)($reg)%si"substr($body$offset)$matches);
  1259.     if (!isset($matches{0}|| !$matches{0}){
  1260.         $retarr false;
  1261.     else {
  1262.         $retarr{0$offset strlen($matches{1});
  1263.         $retarr{1$matches{1};
  1264.         $retarr{2$matches{2};
  1265.     }
  1266.     return $retarr;
  1267. }
  1268.  
  1269. /**
  1270.  * This function looks for the next tag.
  1271.  *
  1272.  * @param  $body   String where to look for the next tag.
  1273.  * @param  $offset Start looking from here.
  1274.  * @return         false if no more tags exist in the body, or
  1275.  *                  an array with the following members:
  1276.  *                  - string with the name of the tag
  1277.  *                  - array with attributes and their values
  1278.  *                  - integer with tag type (1, 2, or 3)
  1279.  *                  - integer where the tag starts (starting "<")
  1280.  *                  - integer where the tag ends (ending ">")
  1281.  *                  first three members will be false, if the tag is invalid.
  1282.  */
  1283. function sq_getnxtag($body$offset){
  1284.     $me 'sq_getnxtag';
  1285.     if ($offset strlen($body)){
  1286.         return false;
  1287.     }
  1288.     $lt sq_findnxstr($body$offset"<");
  1289.     if ($lt == strlen($body)){
  1290.         return false;
  1291.     }
  1292.     /**
  1293.      * We are here:
  1294.      * blah blah <tag attribute="value">
  1295.      * \---------^
  1296.      */
  1297.     $pos sq_skipspace($body$lt+1);
  1298.     if ($pos >= strlen($body)){
  1299.         return Array(falsefalsefalse$ltstrlen($body));
  1300.     }
  1301.     /**
  1302.      * There are 3 kinds of tags:
  1303.      * 1. Opening tag, e.g.:
  1304.      *    <a href="blah">
  1305.      * 2. Closing tag, e.g.:
  1306.      *    </a>
  1307.      * 3. XHTML-style content-less tag, e.g.:
  1308.      *    <img src="blah" />
  1309.      */
  1310.     $tagtype false;
  1311.     switch (substr($body$pos1)){
  1312.         case '/':
  1313.             $tagtype 2;
  1314.             $pos++;
  1315.             break;
  1316.         case '!':
  1317.             /**
  1318.              * A comment or an SGML declaration.
  1319.              */
  1320.             if (substr($body$pos+12== "--"){
  1321.                 $gt strpos($body"-->"$pos);
  1322.                 if ($gt === false){
  1323.                     $gt strlen($body);
  1324.                 else {
  1325.                     $gt += 2;
  1326.                 }
  1327.                 return Array(falsefalsefalse$lt$gt);
  1328.             else {
  1329.                 $gt sq_findnxstr($body$pos">");
  1330.                 return Array(falsefalsefalse$lt$gt);
  1331.             }
  1332.             break;
  1333.         default:
  1334.             /**
  1335.              * Assume tagtype 1 for now. If it's type 3, we'll switch values
  1336.              * later.
  1337.              */
  1338.             $tagtype 1;
  1339.             break;
  1340.     }
  1341.  
  1342.     $tag_start $pos;
  1343.     $tagname '';
  1344.     /**
  1345.      * Look for next [\W-_], which will indicate the end of the tag name.
  1346.      */
  1347.     $regary sq_findnxreg($body$pos"[^\w\-_]");
  1348.     if ($regary == false){
  1349.         return Array(falsefalsefalse$ltstrlen($body));
  1350.     }
  1351.     list($pos$tagname$match$regary;
  1352.     $tagname strtolower($tagname);
  1353.  
  1354.     /**
  1355.      * $match can be either of these:
  1356.      * '>'  indicating the end of the tag entirely.
  1357.      * '\s' indicating the end of the tag name.
  1358.      * '/'  indicating that this is type-3 xhtml tag.
  1359.      *
  1360.      * Whatever else we find there indicates an invalid tag.
  1361.      */
  1362.     switch ($match){
  1363.         case '/':
  1364.             /**
  1365.              * This is an xhtml-style tag with a closing / at the
  1366.              * end, like so: <img src="blah" />. Check if it's followed
  1367.              * by the closing bracket. If not, then this tag is invalid
  1368.              */
  1369.             if (substr($body$pos2== "/>"){
  1370.                 $pos++;
  1371.                 $tagtype 3;
  1372.             else {
  1373.                 $gt sq_findnxstr($body$pos">");
  1374.                 $retary Array(falsefalsefalse$lt$gt);
  1375.                 return $retary;
  1376.             }
  1377.         case '>':
  1378.             return Array($tagnamefalse$tagtype$lt$pos);
  1379.             break;
  1380.         default:
  1381.             /**
  1382.              * Check if it's whitespace
  1383.              */
  1384.             if (!preg_match('/\s/'$match)){
  1385.                 /**
  1386.                  * This is an invalid tag! Look for the next closing ">".
  1387.                  */
  1388.                 $gt sq_findnxstr($body$lt">");
  1389.                 return Array(falsefalsefalse$lt$gt);
  1390.             }
  1391.             break;
  1392.     }
  1393.  
  1394.     /**
  1395.      * At this point we're here:
  1396.      * <tagname  attribute='blah'>
  1397.      * \-------^
  1398.      *
  1399.      * At this point we loop in order to find all attributes.
  1400.      */
  1401.     $attname '';
  1402.     $atttype false;
  1403.     $attary Array();
  1404.  
  1405.     while ($pos <= strlen($body)){
  1406.         $pos sq_skipspace($body$pos);
  1407.         if ($pos == strlen($body)){
  1408.             /**
  1409.              * Non-closed tag.
  1410.              */
  1411.             return Array(falsefalsefalse$lt$pos);
  1412.         }
  1413.         /**
  1414.          * See if we arrived at a ">" or "/>", which means that we reached
  1415.          * the end of the tag.
  1416.          */
  1417.         $matches Array();
  1418.         if (preg_match("%^(\s*)(>|/>)%s"substr($body$pos)$matches)) {
  1419.             /**
  1420.              * Yep. So we did.
  1421.              */
  1422.             $pos += strlen($matches{1});
  1423.             if ($matches{2== "/>"){
  1424.                 $tagtype 3;
  1425.                 $pos++;
  1426.             }
  1427.             return Array($tagname$attary$tagtype$lt$pos);
  1428.         }
  1429.  
  1430.         /**
  1431.          * There are several types of attributes, with optional
  1432.          * [:space:] between members.
  1433.          * Type 1:
  1434.          *   attrname[:space:]=[:space:]'CDATA'
  1435.          * Type 2:
  1436.          *   attrname[:space:]=[:space:]"CDATA"
  1437.          * Type 3:
  1438.          *   attr[:space:]=[:space:]CDATA
  1439.          * Type 4:
  1440.          *   attrname
  1441.          *
  1442.          * We leave types 1 and 2 the same, type 3 we check for
  1443.          * '"' and convert to "&quot" if needed, then wrap in
  1444.          * double quotes. Type 4 we convert into:
  1445.          * attrname="yes".
  1446.          */
  1447.         $regary sq_findnxreg($body$pos"[^:\w\-_]");
  1448.         if ($regary == false){
  1449.             /**
  1450.              * Looks like body ended before the end of tag.
  1451.              */
  1452.             return Array(falsefalsefalse$ltstrlen($body));
  1453.         }
  1454.         list($pos$attname$match$regary;
  1455.         $attname strtolower($attname);
  1456.         /**
  1457.          * We arrived at the end of attribute name. Several things possible
  1458.          * here:
  1459.          * '>'  means the end of the tag and this is attribute type 4
  1460.          * '/'  if followed by '>' means the same thing as above
  1461.          * '\s' means a lot of things -- look what it's followed by.
  1462.          *      anything else means the attribute is invalid.
  1463.          */
  1464.         switch($match){
  1465.             case '/':
  1466.                 /**
  1467.                  * This is an xhtml-style tag with a closing / at the
  1468.                  * end, like so: <img src="blah" />. Check if it's followed
  1469.                  * by the closing bracket. If not, then this tag is invalid
  1470.                  */
  1471.                 if (substr($body$pos2== "/>"){
  1472.                     $pos++;
  1473.                     $tagtype 3;
  1474.                 else {
  1475.                     $gt sq_findnxstr($body$pos">");
  1476.                     $retary Array(falsefalsefalse$lt$gt);
  1477.                     return $retary;
  1478.                 }
  1479.             case '>':
  1480.                 $attary{$attname'"yes"';
  1481.                 return Array($tagname$attary$tagtype$lt$pos);
  1482.                 break;
  1483.             default:
  1484.                 /**
  1485.                  * Skip whitespace and see what we arrive at.
  1486.                  */
  1487.                 $pos sq_skipspace($body$pos);
  1488.                 $char substr($body$pos1);
  1489.                 /**
  1490.                  * Two things are valid here:
  1491.                  * '=' means this is attribute type 1 2 or 3.
  1492.                  * \w means this was attribute type 4.
  1493.                  * anything else we ignore and re-loop. End of tag and
  1494.                  * invalid stuff will be caught by our checks at the beginning
  1495.                  * of the loop.
  1496.                  */
  1497.                 if ($char == "="){
  1498.                     $pos++;
  1499.                     $pos sq_skipspace($body$pos);
  1500.                     /**
  1501.                      * Here are 3 possibilities:
  1502.                      * "'"  attribute type 1
  1503.                      * '"'  attribute type 2
  1504.                      * everything else is the content of tag type 3
  1505.                      */
  1506.                     $quot substr($body$pos1);
  1507.                     if ($quot == "'"){
  1508.                         $regary sq_findnxreg($body$pos+1"\'");
  1509.                         if ($regary == false){
  1510.                             return Array(falsefalsefalse$ltstrlen($body));
  1511.                         }
  1512.                         list($pos$attval$match$regary;
  1513.                         $pos++;
  1514.                         $attary{$attname"'" $attval "'";
  1515.                     else if ($quot == '"'){
  1516.                         $regary sq_findnxreg($body$pos+1'\"');
  1517.                         if ($regary == false){
  1518.                             return Array(falsefalsefalse$ltstrlen($body));
  1519.                         }
  1520.                         list($pos$attval$match$regary;
  1521.                         $pos++;
  1522.                         $attary{$attname'"' $attval '"';
  1523.                     else {
  1524.                         /**
  1525.                          * These are hateful. Look for \s, or >.
  1526.                          */
  1527.                         $regary sq_findnxreg($body$pos"[\s>]");
  1528.                         if ($regary == false){
  1529.                             return Array(falsefalsefalse$ltstrlen($body));
  1530.                         }
  1531.                         list($pos$attval$match$regary;
  1532.                         /**
  1533.                          * If it's ">" it will be caught at the top.
  1534.                          */
  1535.                         $attval preg_replace("/\"/s""&quot;"$attval);
  1536.                         $attary{$attname'"' $attval '"';
  1537.                     }
  1538.                 else if (preg_match("|[\w/>]|"$char)) {
  1539.                     /**
  1540.                      * That was attribute type 4.
  1541.                      */
  1542.                     $attary{$attname'"yes"';
  1543.                 else {
  1544.                     /**
  1545.                      * An illegal character. Find next '>' and return.
  1546.                      */
  1547.                     $gt sq_findnxstr($body$pos">");
  1548.                     return Array(falsefalsefalse$lt$gt);
  1549.                 }
  1550.                 break;
  1551.         }
  1552.     }
  1553.     /**
  1554.      * The fact that we got here indicates that the tag end was never
  1555.      * found. Return invalid tag indication so it gets stripped.
  1556.      */
  1557.     return Array(falsefalsefalse$ltstrlen($body));
  1558. }
  1559.  
  1560. /**
  1561.  * Translates entities into literal values so they can be checked.
  1562.  *
  1563.  * @param $attvalue the by-ref value to check.
  1564.  * @param $regex    the regular expression to check against.
  1565.  * @param $hex      whether the entites are hexadecimal.
  1566.  * @return          True or False depending on whether there were matches.
  1567.  */
  1568. function sq_deent(&$attvalue$regex$hex=false){
  1569.     $me 'sq_deent';
  1570.     $ret_match false;
  1571.     preg_match_all($regex$attvalue$matches);
  1572.     if (is_array($matches&& sizeof($matches[0]0){
  1573.         $repl Array();
  1574.         for ($i 0$i sizeof($matches[0])$i++){
  1575.             $numval $matches[1][$i];
  1576.             if ($hex){
  1577.                 $numval hexdec($numval);
  1578.             }
  1579.             $repl{$matches[0][$i]chr($numval);
  1580.         }
  1581.         $attvalue strtr($attvalue$repl);
  1582.         return true;
  1583.     else {
  1584.         return false;
  1585.     }
  1586. }
  1587.  
  1588. /**
  1589.  * This function runs various checks against the attributes.
  1590.  *
  1591.  * @param  $tagname         String with the name of the tag.
  1592.  * @param  $attary          Array with all tag attributes.
  1593.  * @param  $rm_attnames     See description for sq_sanitize
  1594.  * @param  $bad_attvals     See description for sq_sanitize
  1595.  * @param  $add_attr_to_tag See description for sq_sanitize
  1596.  * @param  $message         message object
  1597.  * @param  $id              message id
  1598.  * @param  $mailbox         mailbox
  1599.  * @return                  Array with modified attributes.
  1600.  */
  1601. function sq_fixatts($tagname,
  1602.                     $attary,
  1603.                     $rm_attnames,
  1604.                     $bad_attvals,
  1605.                     $add_attr_to_tag,
  1606.                     $message,
  1607.                     $id,
  1608.                     $mailbox
  1609.                     ){
  1610.     $me 'sq_fixatts';
  1611.     while (list($attname$attvalueeach($attary)){
  1612.         /**
  1613.          * See if this attribute should be removed.
  1614.          */
  1615.         foreach ($rm_attnames as $matchtag=>$matchattrs){
  1616.             if (preg_match($matchtag$tagname)){
  1617.                 foreach ($matchattrs as $matchattr){
  1618.                     if (preg_match($matchattr$attname)){
  1619.                         unset($attary{$attname});
  1620.                         continue;
  1621.                     }
  1622.                 }
  1623.             }
  1624.         }
  1625.  
  1626.         /**
  1627.          * Workaround for IE quirks
  1628.          */
  1629.         sq_fixIE_idiocy($attvalue);
  1630.  
  1631.         /**
  1632.          * Remove any backslashes, entities, and extraneous whitespace.
  1633.          */
  1634.         $oldattvalue $attvalue;
  1635.         sq_defang($attvalue);
  1636.         if ($attname == 'style' && $attvalue !== $oldattvalue{
  1637.             // entities are used in the attribute value. In 99% of the cases it's there as XSS
  1638.             // i.e.<div style="{ left:exp&#x0280;essio&#x0274;( alert('XSS') ) }">
  1639.             $attvalue "idiocy";
  1640.             $attary{$attname$attvalue;
  1641.         }
  1642.         sq_unspace($attvalue);
  1643.  
  1644.         /**
  1645.          * Now let's run checks on the attvalues.
  1646.          * I don't expect anyone to comprehend this. If you do,
  1647.          * get in touch with me so I can drive to where you live and
  1648.          * shake your hand personally. :)
  1649.          */
  1650.         foreach ($bad_attvals as $matchtag=>$matchattrs){
  1651.             if (preg_match($matchtag$tagname)){
  1652.                 foreach ($matchattrs as $matchattr=>$valary){
  1653.                     if (preg_match($matchattr$attname)){
  1654.                         /**
  1655.                          * There are two arrays in valary.
  1656.                          * First is matches.
  1657.                          * Second one is replacements
  1658.                          */
  1659.                         list($valmatch$valrepl$valary;
  1660.                         $newvalue =
  1661.                             preg_replace($valmatch$valrepl$attvalue);
  1662.                         if ($newvalue != $attvalue){
  1663.                             $attary{$attname$newvalue;
  1664.                             $attvalue $newvalue;
  1665.                         }
  1666.                     }
  1667.                 }
  1668.             }
  1669.         }
  1670.         if ($attname == 'style'{
  1671.             if (preg_match('/[\0-\37\200-\377]+/',$attvalue)) {
  1672.                 // 8bit and control characters in style attribute values can be used for XSS, remove them
  1673.                 $attary{$attname'"disallowed character"';
  1674.             }
  1675.             preg_match_all("/url\s*\((.+)\)/si",$attvalue,$aMatch);
  1676.             if (count($aMatch)) {
  1677.                 foreach($aMatch[1as $sMatch{
  1678.                     // url value
  1679.                     $urlvalue $sMatch;
  1680.                     sq_fix_url($attname$urlvalue$message$id$mailbox,"'");
  1681.                     $attary{$attnamestr_replace($sMatch,$urlvalue,$attvalue);
  1682.                 }
  1683.             }
  1684.         }
  1685.         /**
  1686.          * Use white list based filtering on attributes which can contain url's
  1687.          */
  1688.         else if ($attname == 'href' || $attname == 'xlink:href' || $attname == 'src'
  1689.               || $attname == 'poster' || $attname == 'formaction'
  1690.               || $attname == 'background' || $attname == 'action'{
  1691.             sq_fix_url($attname$attvalue$message$id$mailbox);
  1692.             $attary{$attname$attvalue;
  1693.         }
  1694.     }
  1695.     /**
  1696.      * See if we need to append any attributes to this tag.
  1697.      */
  1698.     foreach ($add_attr_to_tag as $matchtag=>$addattary){
  1699.         if (preg_match($matchtag$tagname)){
  1700.             $attary array_merge($attary$addattary);
  1701.         }
  1702.     }
  1703.     return $attary;
  1704. }
  1705.  
  1706. /**
  1707.  * This function filters url's
  1708.  *
  1709.  * @param  $attvalue        String with attribute value to filter
  1710.  * @param  $message         message object
  1711.  * @param  $id               message id
  1712.  * @param  $mailbox         mailbox
  1713.  * @param  $sQuote          quoting characters around url's
  1714.  */
  1715. function sq_fix_url($attname&$attvalue$message$id$mailbox,$sQuote '"'{
  1716.     $attvalue trim($attvalue);
  1717.     if ($attvalue && ($attvalue[0=='"'|| $attvalue[0== "'")) {
  1718.         // remove the double quotes
  1719.         $sQuote $attvalue[0];
  1720.         $attvalue trim(substr($attvalue,1,-1));
  1721.     }
  1722.  
  1723.     // If there's no "view_unsafe_images" variable in the URL, turn unsafe
  1724.     // images off by default.
  1725.     if!sqgetGlobalVar('view_unsafe_images'$view_unsafe_imagesSQ_GET) ) {
  1726.         $view_unsafe_images false;
  1727.     }
  1728.  
  1729.     if ($use_transparent_security_image$secremoveimg '../images/spacer.png';
  1730.     else $secremoveimg '../images/' _("sec_remove_eng.png");
  1731.  
  1732.     /**
  1733.      * Replace empty src tags with the blank image.  src is only used
  1734.      * for frames, images, and image inputs.  Doing a replace should
  1735.      * not affect them working as should be, however it will stop
  1736.      * IE from being kicked off when src for img tags are not set
  1737.      */
  1738.     if ($attvalue == ''{
  1739.         $attvalue '"' SM_PATH 'images/blank.png"';
  1740.     else {
  1741.         // first, disallow 8 bit characters and control characters
  1742.         if (preg_match('/[\0-\37\200-\377]+/',$attvalue)) {
  1743.             switch ($attname{
  1744.                 case 'href':
  1745.                     $attvalue $sQuote 'http://invalid-stuff-detected.example.com' $sQuote;
  1746.                     break;
  1747.                 default:
  1748.                     $attvalue $sQuote SM_PATH 'images/blank.png'$sQuote;
  1749.                     break;
  1750.             }
  1751.         else {
  1752.             $aUrl parse_url($attvalue);
  1753.             if (isset($aUrl['scheme'])) {
  1754.                 switch(strtolower($aUrl['scheme'])) {
  1755.                     case 'mailto':
  1756.                     case 'http':
  1757.                     case 'https':
  1758.                     case 'ftp':
  1759.                         if ($attname != 'href'{
  1760.                             if ($view_unsafe_images == false{
  1761.                                 $attvalue $sQuote $secremoveimg $sQuote;
  1762.                             else {
  1763.                                 if (isset($aUrl['path'])) {
  1764.  
  1765.                                     // No one has been able to show that image URIs
  1766.                                     // can be exploited, so for now, no restrictions
  1767.                                     // are made at all.  If this proves to be a problem,
  1768.                                     // the commented-out code below can be of help.
  1769.                                     // (One consideration is that I see nothing in this
  1770.                                     // function that specifically says that we will
  1771.                                     // only ever arrive here when inspecting an image
  1772.                                     // tag, although that does seem to be the end
  1773.                                     // result - e.g., <script src="..."> where malicious
  1774.                                     // image URIs are in fact a problem are already
  1775.                                     // filtered out elsewhere.
  1776.                                     /* ---------------------------------
  1777.                                     // validate image extension.
  1778.                                     $ext = strtolower(substr($aUrl['path'],strrpos($aUrl['path'],'.')));
  1779.                                     if (!in_array($ext,array('.jpeg','.jpg','xjpeg','.gif','.bmp','.jpe','.png','.xbm'))) {
  1780.                                         // If URI is to something other than
  1781.                                         // a regular image file, get the contents
  1782.                                         // and try to see if it is an image.
  1783.                                         // Don't use Fileinfo (finfo_file()) because
  1784.                                         // we'd need to make the admin configure the
  1785.                                         // location of the magic.mime file (FIXME: add finfo_file() support later?)
  1786.                                         //
  1787.                                         $mime_type = '';
  1788.                                         if (function_exists('mime_content_type')
  1789.                                          && ($FILE = @fopen($attvalue, 'rb', FALSE))) {
  1790.  
  1791.                                             // fetch file
  1792.                                             //
  1793.                                             $file_contents = '';
  1794.                                             while (!feof($FILE)) {
  1795.                                                 $file_contents .= fread($FILE, 8192);
  1796.                                             }
  1797.                                             fclose($FILE);
  1798.  
  1799.                                             // store file locally
  1800.                                             //
  1801.                                             global $attachment_dir, $username;
  1802.                                             $hashed_attachment_dir = getHashedDir($username, $attachment_dir);
  1803.                                             $localfilename = GenerateRandomString(32, '', 7);
  1804.                                             $full_localfilename = "$hashed_attachment_dir/$localfilename";
  1805.                                             while (file_exists($full_localfilename)) {
  1806.                                                 $localfilename = GenerateRandomString(32, '', 7);
  1807.                                                 $full_localfilename = "$hashed_attachment_dir/$localfilename";
  1808.                                             }
  1809.                                             $FILE = fopen("$hashed_attachment_dir/$localfilename", 'wb');
  1810.                                             fwrite($FILE, $file_contents);
  1811.                                             fclose($FILE);
  1812.  
  1813.                                             // get mime type and remove file
  1814.                                             //
  1815.                                             $mime_type = mime_content_type("$hashed_attachment_dir/$localfilename");
  1816.                                             unlink("$hashed_attachment_dir/$localfilename");
  1817.                                         }
  1818.                                         // debug: echo "$attvalue FILE TYPE IS $mime_type<HR>";
  1819.                                         if (substr(strtolower($mime_type), 0, 5) != 'image') {
  1820.                                             $attvalue = $sQuote . SM_PATH . 'images/blank.png'. $sQuote;
  1821.                                         }
  1822.                                     }
  1823.                                     --------------------------------- */
  1824.                                 else {
  1825.                                     $attvalue $sQuote SM_PATH 'images/blank.png'$sQuote;
  1826.                                 }
  1827.                             }
  1828.                         else {
  1829.                             $attvalue $sQuote $attvalue $sQuote;
  1830.                         }
  1831.                         break;
  1832.                     case 'outbind':
  1833.                         /**
  1834.                          * "Hack" fix for Outlook using propriatary outbind:// protocol in img tags.
  1835.                          * One day MS might actually make it match something useful, for now, falling
  1836.                          * back to using cid2http, so we can grab the blank.png.
  1837.                          */
  1838.                         $attvalue $sQuote sq_cid2http($message$id$attvalue$mailbox$sQuote;
  1839.                         break;
  1840.                     case 'cid':
  1841.                         /**
  1842.                             * Turn cid: urls into http-friendly ones.
  1843.                             */
  1844.                         $attvalue $sQuote sq_cid2http($message$id$attvalue$mailbox$sQuote;
  1845.                         break;
  1846.                     default:
  1847.                         $attvalue $sQuote SM_PATH 'images/blank.png' $sQuote;
  1848.                         break;
  1849.                 }
  1850.             else {
  1851.                 if (!(isset($aUrl['path']&& $aUrl['path'== $secremoveimg)) {
  1852.                     // parse_url did not lead to satisfying result
  1853.                     $attvalue $sQuote SM_PATH 'images/blank.png' $sQuote;
  1854.                 }
  1855.             }
  1856.         }
  1857.     }
  1858. }
  1859.  
  1860. /**
  1861.  * This function edits the style definition to make them friendly and
  1862.  * usable in SquirrelMail.
  1863.  *
  1864.  * @param  $message  the message object
  1865.  * @param  $id       the message id
  1866.  * @param  $content  a string with whatever is between <style> and </style>
  1867.  * @param  $mailbox  the message mailbox
  1868.  * @return           string with edited content.
  1869.  */
  1870. function sq_fixstyle($body$pos$message$id$mailbox){
  1871.     // FIXME: Is the global "view_unsafe_images" really needed here?
  1872.     global $view_unsafe_images;
  1873.     $me 'sq_fixstyle';
  1874.  
  1875.     // workaround for </style> in between comments
  1876.     $iCurrentPos $pos;
  1877.     $content '';
  1878.     $sToken '';
  1879.     $bSucces false;
  1880.     $bEndTag false;
  1881.     for ($i=$pos,$iCount=strlen($body);$i<$iCount;++$i{
  1882.         $char $body{$i};
  1883.         switch ($char{
  1884.             case '<':
  1885.                 $sToken $char;
  1886.                 break;
  1887.             case '/':
  1888.                  if ($sToken == '<'{
  1889.                     $sToken .= $char;
  1890.                     $bEndTag true;
  1891.                  else {
  1892.                     $content .= $char;
  1893.                  }
  1894.                  break;
  1895.             case '>':
  1896.                  if ($bEndTag{
  1897.                     $sToken .= $char;
  1898.                     if (preg_match('/\<\/\s*style\s*\>/i',$sToken,$aMatch)) {
  1899.                         $newpos $i 1;
  1900.                         $bSucces true;
  1901.                         break 2;
  1902.                     else {
  1903.                         $content .= $sToken;
  1904.                     }
  1905.                     $bEndTag false;
  1906.                  else {
  1907.                     $content .= $char;
  1908.                  }
  1909.                  break;
  1910.             case '!':
  1911.                 if ($sToken == '<'{
  1912.                     // possible comment
  1913.                     if (isset($body{$i+2}&& substr($body,$i,3== '!--'{
  1914.                         $i strpos($body,'-->',$i+3);
  1915.                         if ($i === false// no end comment
  1916.                             $i strlen($body);
  1917.                         }
  1918.                         $sToken '';
  1919.                     }
  1920.                 else {
  1921.                     $content .= $char;
  1922.                 }
  1923.                 break;
  1924.             default:
  1925.                 if ($bEndTag{
  1926.                     $sToken .= $char;
  1927.                 else {
  1928.                     $content .= $char;
  1929.                 }
  1930.                 break;
  1931.         }
  1932.     }
  1933.     if ($bSucces == FALSE){
  1934.         return array(FALSEstrlen($body));
  1935.     }
  1936.  
  1937.     /**
  1938.      * First look for general BODY style declaration, which would be
  1939.      * like so:
  1940.      * body {background: blah-blah}
  1941.      * and change it to .bodyclass so we can just assign it to a <div>
  1942.      */
  1943.     // $content = preg_replace("|body(\s*\{.*?\})|si", ".bodyclass\\1", $content);
  1944.     // Nah, this is even better - try to preface all CSS selectors with
  1945.     // our <div> class ID "bodyclass" then correct generic "body" selectors
  1946.     // TODO: this works pretty good but breaks stuff like this:
  1947.     //       @media print { body { font-size: 10pt; } }
  1948.     //       but there isn't an easy way to make this regex skip @media
  1949.     //       definitions... though lots of the ones in the wild will be
  1950.     //       correctly handled because they tend to end with a parenthesis, like:
  1951.     //       @media screen and (max-width:480px) { ...
  1952.     $content preg_replace('/([a-z0-9._-][a-z0-9 >+~|:._-]*\s*(?:,|{.*?}))/si''.bodyclass $1'$content);
  1953.     $content str_replace('.bodyclass body''.bodyclass'$content);
  1954.  
  1955.     if ($use_transparent_security_image$secremoveimg '../images/spacer.png';
  1956.     else $secremoveimg '../images/' _("sec_remove_eng.png");
  1957.  
  1958.     // first check for 8bit sequences and disallowed control characters
  1959.     if (preg_match('/[\16-\37\200-\377]+/',$content)) {
  1960.         $content '<!-- style block removed by html filter due to presence of 8bit characters -->';
  1961.         return array($content$newpos);
  1962.     }
  1963.  
  1964.     // IE Sucks hard. We have a special function for it.
  1965.     sq_fixIE_idiocy($content);
  1966.  
  1967.     // remove @import line
  1968.     $content preg_replace("/^\s*(@import.*)$/mi","\n<!-- @import rules forbidden -->\n",$content);
  1969.  
  1970.     /**
  1971.      * Fix url('blah') declarations.
  1972.      */
  1973.     // translate ur\l and variations into url (IE parses that)
  1974.     // TODO check if the sq_fixIE_idiocy function already handles this.
  1975.     $content preg_replace("/(\\\\)?u(\\\\)?r(\\\\)?l(\\\\)?/i",'url'$content);
  1976.     preg_match_all("/url\s*\((.+)\)/si",$content,$aMatch);
  1977.     if (count($aMatch)) {
  1978.         $aValue $aReplace array();
  1979.         foreach($aMatch[1as $sMatch{
  1980.             // url value
  1981.             $urlvalue $sMatch;
  1982.             sq_fix_url('style',$urlvalue$message$id$mailbox,"'");
  1983.             $aValue[$sMatch;
  1984.             $aReplace[$urlvalue;
  1985.         }
  1986.         $content str_replace($aValue,$aReplace,$content);
  1987.     }
  1988.  
  1989.     /**
  1990.      * Remove any backslashes, entities, and extraneous whitespace.
  1991.      */
  1992.     $contentTemp $content;
  1993.     sq_defang($contentTemp);
  1994.     sq_unspace($contentTemp);
  1995.  
  1996.     /**
  1997.      * Fix stupid css declarations which lead to vulnerabilities
  1998.      * in IE.
  1999.      *
  2000.      * Also remove "position" attribute, as it can easily be set
  2001.      * to "fixed" or "absolute" with "left" and "top" attributes
  2002.      * of zero, taking over the whole content frame.  It can also
  2003.      * be set to relative and move itself anywhere it wants to,
  2004.      * displaying content in areas it shouldn't be allowed to touch.
  2005.      */
  2006.     $match   Array('/\/\*.*\*\//'// removes /* blah blah */
  2007.                     '/expression/i',
  2008.                     '/behaviou*r/i',
  2009.                     '/binding/i',
  2010.                     '/include-source/i',
  2011.                     '/javascript/i',
  2012.                     '/script/i',
  2013.                     '/position/i');
  2014.     $replace Array('','idiocy''idiocy''idiocy''idiocy''idiocy''idiocy''');
  2015.     $contentNew preg_replace($match$replace$contentTemp);
  2016.     if ($contentNew !== $contentTemp{
  2017.         // insecure css declarations are used. From now on we don't care
  2018.         // anymore if the css is destroyed by sq_deent, sq_unspace or sq_unbackslash
  2019.         $content $contentNew;
  2020.     }
  2021.     return array($content$newpos);
  2022. }
  2023.  
  2024.  
  2025. /**
  2026.  * This function converts cid: url's into the ones that can be viewed in
  2027.  * the browser.
  2028.  *
  2029.  * @param  $message  the message object
  2030.  * @param  $id       the message id
  2031.  * @param  $cidurl   the cid: url.
  2032.  * @param  $mailbox  the message mailbox
  2033.  * @return           string with a http-friendly url
  2034.  */
  2035. function sq_cid2http($message$id$cidurl$mailbox){
  2036.     /**
  2037.      * Get rid of quotes.
  2038.      */
  2039.     $quotchar substr($cidurl01);
  2040.     if ($quotchar == '"' || $quotchar == "'"){
  2041.         $cidurl str_replace($quotchar""$cidurl);
  2042.     else {
  2043.         $quotchar '';
  2044.     }
  2045.     $cidurl substr(trim($cidurl)4);
  2046.  
  2047.     $match_str '/\{.*?\}\//';
  2048.     $str_rep '';
  2049.     $cidurl preg_replace($match_str$str_rep$cidurl);
  2050.  
  2051.     $linkurl find_ent_id($cidurl$message);
  2052.     /* in case of non-safe cid links $httpurl should be replaced by a sort of
  2053.        unsafe link image */
  2054.     $httpurl '';
  2055.  
  2056.     /**
  2057.      * This is part of a fix for Outlook Express 6.x generating
  2058.      * cid URLs without creating content-id headers. These images are
  2059.      * not part of the multipart/related html mail. The html contains
  2060.      * <img src="cid:{some_id}/image_filename.ext"> references to
  2061.      * attached images with as goal to render them inline although
  2062.      * the attachment disposition property is not inline.
  2063.      */
  2064.  
  2065.     if (empty($linkurl)) {
  2066.         if (preg_match('/{.*}\//'$cidurl)) {
  2067.             $cidurl preg_replace('/{.*}\//',''$cidurl);
  2068.             if (!empty($cidurl)) {
  2069.                 $linkurl find_ent_id($cidurl$message);
  2070.             }
  2071.         }
  2072.     }
  2073.  
  2074.     if (!empty($linkurl)) {
  2075.         $httpurl $quotchar SM_PATH 'src/download.php?absolute_dl=true&amp;' .
  2076.             "passed_id=$id&amp;mailbox=urlencode($mailbox.
  2077.             '&amp;ent_id=' $linkurl $quotchar;
  2078.     else {
  2079.         /**
  2080.          * If we couldn't generate a proper img url, drop in a blank image
  2081.          * instead of sending back empty, otherwise it causes unusual behaviour
  2082.          */
  2083.         $httpurl $quotchar SM_PATH 'images/blank.png' $quotchar;
  2084.     }
  2085.  
  2086.     return $httpurl;
  2087. }
  2088.  
  2089. /**
  2090.  * This function changes the <body> tag into a <div> tag since we
  2091.  * can't really have a body-within-body.
  2092.  *
  2093.  * @param  $attary   an array of attributes and values of <body>
  2094.  * @param  $mailbox  mailbox we're currently reading (for cid2http)
  2095.  * @param  $message  current message (for cid2http)
  2096.  * @param  $id       current message id (for cid2http)
  2097.  * @return           modified array of attributes to be set for <div>
  2098.  */
  2099. function sq_body2div($attary$mailbox$message$id){
  2100.     $me 'sq_body2div';
  2101.     $divattary Array('class' => "'bodyclass'");
  2102.     $bgcolor '#ffffff';
  2103.     $text '#000000';
  2104.     $styledef '';
  2105.     if (is_array($attary&& sizeof($attary0){
  2106.         foreach ($attary as $attname=>$attvalue){
  2107.             $quotchar substr($attvalue01);
  2108.             $attvalue str_replace($quotchar""$attvalue);
  2109.             switch ($attname){
  2110.                 case 'background':
  2111.                     $attvalue sq_cid2http($message$id$attvalue$mailbox);
  2112.                     $styledef .= "background-image: url('$attvalue'); ";
  2113.                     break;
  2114.                 case 'bgcolor':
  2115.                     $styledef .= "background-color: $attvalue";
  2116.                     break;
  2117.                 case 'text':
  2118.                     $styledef .= "color: $attvalue";
  2119.                     break;
  2120.             }
  2121.         }
  2122.         if (strlen($styledef0){
  2123.             $divattary{"style""\"$styledef\"";
  2124.         }
  2125.     }
  2126.     return $divattary;
  2127. }
  2128.  
  2129. /**
  2130.  * This is the main function and the one you should actually be calling.
  2131.  * There are several variables you should be aware of an which need
  2132.  * special description.
  2133.  *
  2134.  * Since the description is quite lengthy, see it here:
  2135.  * http://linux.duke.edu/projects/mini/htmlfilter/
  2136.  *
  2137.  * @param $body                 the string with HTML you wish to filter
  2138.  * @param $tag_list             see description above
  2139.  * @param $rm_tags_with_content see description above
  2140.  * @param $self_closing_tags    see description above
  2141.  * @param $force_tag_closing    see description above
  2142.  * @param $rm_attnames          see description above
  2143.  * @param $bad_attvals          see description above
  2144.  * @param $add_attr_to_tag      see description above
  2145.  * @param $message              message object
  2146.  * @param $id                   message id
  2147.  * @param $recursively_called   boolean flag for recursive calls into this function (optional; default FALSE)
  2148.  * @return                      sanitized html safe to show on your pages.
  2149.  */
  2150. function sq_sanitize($body,
  2151.                      $tag_list,
  2152.                      $rm_tags_with_content,
  2153.                      $self_closing_tags,
  2154.                      $force_tag_closing,
  2155.                      $rm_attnames,
  2156.                      $bad_attvals,
  2157.                      $add_attr_to_tag,
  2158.                      $message,
  2159.                      $id,
  2160.                      $mailbox,
  2161.                      $recursively_called=FALSE
  2162.                      ){
  2163.     $me 'sq_sanitize';
  2164.  
  2165.     /**
  2166.      * See if tag_list is of tags to remove or tags to allow.
  2167.      * false  means remove these tags
  2168.      * true   means allow these tags
  2169.      */
  2170.     $orig_tag_list $tag_list;
  2171.     $rm_tags array_shift($tag_list);
  2172.  
  2173.     /**
  2174.      * Normalize rm_tags and rm_tags_with_content.
  2175.      */
  2176.     @array_walk($tag_list'sq_casenormalize');
  2177.     @array_walk($rm_tags_with_content'sq_casenormalize');
  2178.     @array_walk($self_closing_tags'sq_casenormalize');
  2179.  
  2180.     $curpos 0;
  2181.     $open_tags Array();
  2182.     $trusted "\n<!-- begin sanitized html -->\n";
  2183.     $skip_content false;
  2184.     /**
  2185.      * Take care of netscape's stupid javascript entities like
  2186.      * &{alert('boo')};
  2187.      */
  2188.     $body preg_replace("/&(\{.*?\};)/si""&amp;\\1"$body);
  2189.  
  2190.     while (($curtag sq_getnxtag($body$curpos)) != FALSE){
  2191.         list($tagname$attary$tagtype$lt$gt$curtag;
  2192.  
  2193.         /**
  2194.          * RCDATA and RAWTEXT tags are handled differently:
  2195.          * next instance of closing tag is used, whether or not
  2196.          * the HTML is well formed before that
  2197.          */
  2198.         global $rcdata_rawtext_tags;
  2199.         if (!$recursively_called
  2200.          && in_array($tagname$rcdata_rawtext_tags)
  2201.          && $tagtype === 1){
  2202.             $closing_tag false;
  2203.             $closing_tag_offset $curpos;
  2204.             // seek out the closing tag for the current RCDATA/RAWTEXT tag
  2205.             while (1{
  2206.                 // first we need to move forward to next available closing tag
  2207.                 // (intentionally leave off the closing > and let sq_getnxtag() validate a proper tag syntax)
  2208.                 $next_tag sq_findnxreg($body$closing_tag_offset"</\s*$tagname");
  2209.                 if ($next_tag === false{
  2210.                     $closing_tag false;
  2211.                     break;
  2212.                 }
  2213.                 // but then we have to make sure it's a well-formed tag
  2214.                 $closing_tag sq_getnxtag($body$next_tag[0]);
  2215.                 if ($closing_tag === false)
  2216.                     break;
  2217.                 else if ($closing_tag[0!== false
  2218.                  // these should be redundant
  2219.                  && $closing_tag[0=== $tagname && $closing_tag[2=== 2{
  2220.                     $trusted .= sq_sanitize(substr($body$curpos$closing_tag[4$curpos 1),
  2221.                                             $orig_tag_list$rm_tags_with_content$self_closing_tags,
  2222.                                             $force_tag_closing$rm_attnames$bad_attvals$add_attr_to_tag,
  2223.                                             $message$id$mailboxtrue);
  2224.                     $curpos $closing_tag[41;
  2225.                     continue 2;
  2226.                 }
  2227.                 $closing_tag_offset $next_tag[01;
  2228.             }
  2229.             if ($closing_tag === false)
  2230.             /* no-op... there was no closing tag for this RCDATA/RAWTEXT tag - we could probably set $curpos to the end of $body, but this HTML is malformed anyway and should just fall apart on its own */ }
  2231.         }
  2232.  
  2233.         $free_content substr($body$curpos$lt-$curpos);
  2234.         /**
  2235.          * Take care of <style>
  2236.          */
  2237.         if ($tagname == "style" && $tagtype == 1){
  2238.             list($free_content$curpos=
  2239.                 sq_fixstyle($body$gt+1$message$id$mailbox);
  2240.             if ($free_content != FALSE){
  2241.                 if !empty ($attary) ) {
  2242.                     $attary sq_fixatts($tagname,
  2243.                                          $attary,
  2244.                                          $rm_attnames,
  2245.                                          $bad_attvals,
  2246.                                          $add_attr_to_tag,
  2247.                                          $message,
  2248.                                          $id,
  2249.                                          $mailbox
  2250.                                          );
  2251.                 }
  2252.                 $trusted .= sq_tagprint($tagname$attary$tagtype);
  2253.                 $trusted .= $free_content;
  2254.                 $trusted .= sq_tagprint($tagnamefalse2);
  2255.             }
  2256.             continue;
  2257.         }
  2258.         if ($skip_content == false){
  2259.             $trusted .= $free_content;
  2260.         }
  2261.         if ($tagname != FALSE){
  2262.             if ($tagtype == 2){
  2263.                 if ($skip_content == $tagname){
  2264.                     /**
  2265.                      * Got to the end of tag we needed to remove.
  2266.                      */
  2267.                     $tagname false;
  2268.                     $skip_content false;
  2269.                 else {
  2270.                     if ($skip_content == false){
  2271.                         if ($tagname == "body"){
  2272.                             $tagname "div";
  2273.                         }
  2274.                         if (isset($open_tags{$tagname}&&
  2275.                                 $open_tags{$tagname0){
  2276.                             $open_tags{$tagname}--;
  2277.                         else {
  2278.                             $tagname false;
  2279.                         }
  2280.                     }
  2281.                 }
  2282.             else {
  2283.                 /**
  2284.                  * $rm_tags_with_content
  2285.                  */
  2286.                 if ($skip_content == false){
  2287.                     /**
  2288.                      * See if this is a self-closing type and change
  2289.                      * tagtype appropriately.
  2290.                      */
  2291.                     if ($tagtype == 1
  2292.                             && in_array($tagname$self_closing_tags)){
  2293.                         $tagtype 3;
  2294.                     }
  2295.                     /**
  2296.                      * See if we should skip this tag and any content
  2297.                      * inside it.
  2298.                      */
  2299.                     if ($tagtype == &&
  2300.                             in_array($tagname$rm_tags_with_content)){
  2301.                         $skip_content $tagname;
  2302.                     else {
  2303.                         if (($rm_tags == false
  2304.                                     && in_array($tagname$tag_list)) ||
  2305.                                 ($rm_tags == true &&
  2306.                                  !in_array($tagname$tag_list))){
  2307.                             $tagname false;
  2308.                         else {
  2309.                             /**
  2310.                              * Convert body into div.
  2311.                              */
  2312.                             if ($tagname == "body"){
  2313.                                 $tagname "div";
  2314.                                 $attary sq_body2div($attary$mailbox,
  2315.                                         $message$id);
  2316.                             }
  2317.                             if ($tagtype == 1){
  2318.                                 if (isset($open_tags{$tagname})){
  2319.                                     $open_tags{$tagname}++;
  2320.                                 else {
  2321.                                     $open_tags{$tagname}=1;
  2322.                                 }
  2323.                             }
  2324.                             /**
  2325.                              * This is where we run other checks.
  2326.                              */
  2327.                             if (is_array($attary&& sizeof($attary0){
  2328.                                 $attary sq_fixatts($tagname,
  2329.                                                      $attary,
  2330.                                                      $rm_attnames,
  2331.                                                      $bad_attvals,
  2332.                                                      $add_attr_to_tag,
  2333.                                                      $message,
  2334.                                                      $id,
  2335.                                                      $mailbox
  2336.                                                      );
  2337.                             }
  2338.                         }
  2339.                     }
  2340.                 }
  2341.             }
  2342.             if ($tagname != false && $skip_content == false){
  2343.                 $trusted .= sq_tagprint($tagname$attary$tagtype);
  2344.             }
  2345.         }
  2346.         $curpos $gt+1;
  2347.     }
  2348.     $trusted .= substr($body$curposstrlen($body)-$curpos);
  2349.     if ($force_tag_closing == true){
  2350.         foreach ($open_tags as $tagname=>$opentimes){
  2351.             while ($opentimes 0){
  2352.                 $trusted .= '</' $tagname '>';
  2353.                 $opentimes--;
  2354.             }
  2355.         }
  2356.         $trusted .= "\n";
  2357.     }
  2358.     $trusted .= "<!-- end sanitized html -->\n";
  2359.     return $trusted;
  2360. }
  2361.  
  2362. /**
  2363.  * This is a wrapper function to call html sanitizing routines.
  2364.  *
  2365.  * @param  $body  the body of the message
  2366.  * @param  $id    the id of the message
  2367.  * @param  boolean $take_mailto_links When TRUE, converts mailto: links
  2368.  *                                     into internal SM compose links
  2369.  *                                     (optional; default = TRUE)
  2370.  * @return        string with html safe to display in the browser.
  2371.  */
  2372. function magicHTML($body$id$message$mailbox 'INBOX'$take_mailto_links =true{
  2373.  
  2374.     require_once(SM_PATH 'functions/url_parser.php');  // for $MailTo_PReg_Match
  2375.  
  2376.     global $attachment_common_show_images$view_unsafe_images,
  2377.            $has_unsafe_images$allow_svg_display$rcdata_rawtext_tags,
  2378.            $remove_rcdata_rawtext_tags_and_content;
  2379.  
  2380.     $rcdata_rawtext_tags array(
  2381.         "noscript",
  2382.         "noframes",
  2383.         "noembed",
  2384.         "textarea",
  2385.         // also "title", "xmp", "script", "iframe", "plaintext" which we already remove below
  2386.     );
  2387.  
  2388.     /**
  2389.      * Don't display attached images in HTML mode.
  2390.      */
  2391.     $attachment_common_show_images false;
  2392.     $tag_list Array(
  2393.             false// remove these tags
  2394.             "meta",
  2395.             "html",
  2396.             "head",
  2397.             "base",
  2398.             "link",
  2399.             "frame",
  2400.             "iframe",
  2401.             "plaintext",
  2402.             "marquee",
  2403.             );
  2404.  
  2405.     $rm_tags_with_content Array(
  2406.             "script",
  2407.             "object",
  2408.             "applet",
  2409.             "embed",
  2410.             "title",
  2411.             "frameset",
  2412.             "xmp",
  2413.             "xml",
  2414.             );
  2415.     if (!$allow_svg_display)
  2416.         $rm_tags_with_content['svg';
  2417.     /**
  2418.      * SquirrelMail will parse RCDATA and RAWTEXT tags and handle them as the special
  2419.      * case that they are, but if you prefer to remove them and their contents entirely
  2420.      * (in most cases, should be a safe thing with minimal impact), you can add the
  2421.      * following to config/config_local.php
  2422.      *    $remove_rcdata_rawtext_tags_and_content = TRUE; 
  2423.      */
  2424.     if ($remove_rcdata_rawtext_tags_and_content)
  2425.         $rm_tags_with_content array_merge($rm_tags_with_content$rcdata_rawtext_tags);
  2426.  
  2427.     $self_closing_tags =  Array(
  2428.             "img",
  2429.             "br",
  2430.             "hr",
  2431.             "input",
  2432.             "outbind",
  2433.             );
  2434.  
  2435.     $force_tag_closing true;
  2436.  
  2437.     $rm_attnames Array(
  2438.             "/.*/" =>
  2439.             Array(
  2440.                 "/target/i",
  2441.                 "/^on.*/i",
  2442.                 "/^dynsrc/i",
  2443.                 "/^data.*/i",
  2444.                 "/^lowsrc.*/i",
  2445.                 )
  2446.             );
  2447.  
  2448.     if ($use_transparent_security_image$secremoveimg '../images/spacer.png';
  2449.     else $secremoveimg '../images/' _("sec_remove_eng.png");
  2450.  
  2451.     $bad_attvals Array(
  2452.             "/.*/" =>
  2453.             Array(
  2454.                 "/^src|background/i" =>
  2455.                 Array(
  2456.                     Array(
  2457.                         "/^([\'\"])\s*\S+script\s*:.*([\'\"])/si",
  2458.                         "/^([\'\"])\s*mocha\s*:*.*([\'\"])/si",
  2459.                         "/^([\'\"])\s*about\s*:.*([\'\"])/si"
  2460.                         ),
  2461.                     Array(
  2462.                         "\\1$secremoveimg\\2",
  2463.                         "\\1$secremoveimg\\2",
  2464.                         "\\1$secremoveimg\\2"
  2465.                         )
  2466.                     ),
  2467.                 "/^href|action/i" =>
  2468.                 Array(
  2469.                     Array(
  2470.                         "/^([\'\"])\s*\S+script\s*:.*([\'\"])/si",
  2471.                         "/^([\'\"])\s*mocha\s*:*.*([\'\"])/si",
  2472.                         "/^([\'\"])\s*about\s*:.*([\'\"])/si"
  2473.                         ),
  2474.                     Array(
  2475.                         "\\1#\\1",
  2476.                         "\\1#\\1",
  2477.                         "\\1#\\1"
  2478.                         )
  2479.                     ),
  2480.         "/^style/i" =>
  2481.             Array(
  2482.                 Array(
  2483.                     "/\/\*.*\*\//",
  2484.                     "/expression/i",
  2485.                     "/binding/i",
  2486.                     "/behaviou*r/i",
  2487.                     "/include-source/i",
  2488.  
  2489.                     // position:relative can also be exploited
  2490.                     // to put content outside of email body area
  2491.                     // and position:fixed is similarly exploitable
  2492.                     // as position:absolute, so we'll remove it
  2493.                     // altogether....
  2494.                     //
  2495.                     // Does this screw up legitimate HTML messages?
  2496.                     // If so, the only fix I see is to allow position
  2497.                     // attributes (any values?  I think we still have
  2498.                     // to block static and fixed) only if $use_iframe
  2499.                     // is enabled (1.5.0+)
  2500.                     //
  2501.                     // was:   "/position\s*:\s*absolute/i",
  2502.                     //
  2503.                     "/position\s*:/i",
  2504.  
  2505.                     "/(\\\\)?u(\\\\)?r(\\\\)?l(\\\\)?/i",
  2506.                     "/url\s*\(\s*([\'\"])\s*\S+script\s*:.*([\'\"])\s*\)/si",
  2507.                     "/url\s*\(\s*([\'\"])\s*mocha\s*:.*([\'\"])\s*\)/si",
  2508.                     "/url\s*\(\s*([\'\"])\s*about\s*:.*([\'\"])\s*\)/si",
  2509.                     "/(.*)\s*:\s*url\s*\(\s*([\'\"]*)\s*\S+script\s*:.*([\'\"]*)\s*\)/si",
  2510.                     ),
  2511.                 Array(
  2512.                     "",
  2513.                     "idiocy",
  2514.                     "idiocy",
  2515.                     "idiocy",
  2516.                     "idiocy",
  2517.                     "idiocy",
  2518.                     "url",
  2519.                     "url(\\1#\\1)",
  2520.                     "url(\\1#\\1)",
  2521.                     "url(\\1#\\1)",
  2522.                     "\\1:url(\\2#\\3)"
  2523.                     )
  2524.                 )
  2525.             )
  2526.         );
  2527.  
  2528.     // If there's no "view_unsafe_images" variable in the URL, turn unsafe
  2529.     // images off by default.
  2530.     if!sqgetGlobalVar('view_unsafe_images'$view_unsafe_imagesSQ_GET) ) {
  2531.         $view_unsafe_images false;
  2532.     }
  2533.  
  2534.     if (!$view_unsafe_images){
  2535.         /**
  2536.          * Remove any references to http/https if view_unsafe_images set
  2537.          * to false.
  2538.          */
  2539.         array_push($bad_attvals{'/.*/'}{'/^src|background/i'}[0],
  2540.                 '/^([\'\"])\s*https*:.*([\'\"])/si');
  2541.         array_push($bad_attvals{'/.*/'}{'/^src|background/i'}[1],
  2542.                 "\\1$secremoveimg\\1");
  2543.         array_push($bad_attvals{'/.*/'}{'/^style/i'}[0],
  2544.                 '/url\([\'\"]?https?:[^\)]*[\'\"]?\)/si');
  2545.         array_push($bad_attvals{'/.*/'}{'/^style/i'}[1],
  2546.                 "url(\\1$secremoveimg\\1)");
  2547.     }
  2548.  
  2549.     $add_attr_to_tag Array(
  2550.             "/^a$/i" =>
  2551.             Array('target'=>'"_blank"',
  2552.                 'title'=>'"'._("This external link will open in a new window").'"'
  2553.                 )
  2554.             );
  2555.     $trusted sq_sanitize($body,
  2556.                            $tag_list,
  2557.                            $rm_tags_with_content,
  2558.                            $self_closing_tags,
  2559.                            $force_tag_closing,
  2560.                            $rm_attnames,
  2561.                            $bad_attvals,
  2562.                            $add_attr_to_tag,
  2563.                            $message,
  2564.                            $id,
  2565.                            $mailbox
  2566.                            );
  2567.     if (strpos($trusted,$secremoveimg)){
  2568.         $has_unsafe_images true;
  2569.     }
  2570.  
  2571.     // we want to parse mailto's in HTML output, change to SM compose links
  2572.     // this is a modified version of code from url_parser.php... but Marc is
  2573.     // right: we need a better filtering implementation; adding this randomly
  2574.     // here is not a great solution
  2575.     //
  2576.     if ($take_mailto_links{
  2577.         // parseUrl($trusted);   // this even parses URLs inside of tags... too aggressive
  2578.         global $MailTo_PReg_Match;
  2579.         // some mailers (Microsoft, surprise surprise) produce mailto strings without being
  2580.         // inside an anchor (link) tag, so we have to make sure the regex looks for the
  2581.         // quote before mailto, and we'll also try to convert the non-links back into links
  2582.         $MailTo_PReg_Match '/([\'"])?mailto:' substr($MailTo_PReg_Match1;
  2583.         if ((preg_match_all($MailTo_PReg_Match$trusted$regs)) && ($regs[0][0!= '')) {
  2584.             foreach ($regs[0as $i => $mailto_before{
  2585.                 $mailto_params $regs[11][$i];
  2586.  
  2587.                 // get rid of any leading quote we may have captured but don't care about
  2588.                 //
  2589.                 $mailto_before ltrim($mailto_before'"\'');
  2590.  
  2591.                 // get rid of any tailing quote since we have to add send_to to the end
  2592.                 //
  2593.                 $mailto_before rtrim($mailto_before'"\'');
  2594.                 $mailto_params rtrim($mailto_params'"\'');
  2595.  
  2596.                 if ($regs[2][$i]{    //if there is an email addr before '?', we need to merge it with the params
  2597.                     $to 'to=' $regs[2][$i];
  2598.                     if (strpos($mailto_params'to='> -1)    //already a 'to='
  2599.                         $mailto_params str_replace('to='$to '%2C%20'$mailto_params);
  2600.                     else {
  2601.                         if ($mailto_params)    //already some params, append to them
  2602.                             $mailto_params .= '&amp;' $to;
  2603.                         else
  2604.                             $mailto_params .= '?' $to;
  2605.                     }
  2606.                 }
  2607.  
  2608.                 $url_str preg_replace(array('/to=/i''/(?<!b)cc=/i''/bcc=/i')array('send_to=''send_to_cc=''send_to_bcc=')$mailto_params);
  2609.  
  2610.                 // we'll already have target=_blank, no need to allow comp_in_new
  2611.                 // here (which would be a lot more work anyway)
  2612.                 //
  2613.                 global $compose_new_win;
  2614.                 $temp_comp_in_new $compose_new_win;
  2615.                 $compose_new_win 0;
  2616.                 $comp_uri makeComposeLink('src/compose.php' $url_str$mailto_before);
  2617.                 $compose_new_win $temp_comp_in_new;
  2618.  
  2619.                 // remove <a href=" and anything after the next quote (we only
  2620.                 // need the uri, not the link HTML) in compose uri
  2621.                 //
  2622.                 // but only do this if the original mailto was in a real anchor tag
  2623.                 //
  2624.                 if (!empty($regs[1][$i])) {
  2625.                     $comp_uri substr($comp_uri9);
  2626.                     $comp_uri substr($comp_uri0strpos($comp_uri'"'1));
  2627.                 }
  2628.                 $trusted str_replace($mailto_before$comp_uri$trusted);
  2629.             }
  2630.         }
  2631.     }
  2632.  
  2633.     return $trusted;
  2634. }
  2635.  
  2636. /**
  2637.  * function SendDownloadHeaders - send file to the browser
  2638.  *
  2639.  * Original Source: SM core src/download.php
  2640.  * moved here to make it available to other code, and separate
  2641.  * front end from back end functionality.
  2642.  *
  2643.  * @param string $type0 first half of mime type
  2644.  * @param string $type1 second half of mime type
  2645.  * @param string $filename filename to tell the browser for downloaded file
  2646.  * @param boolean $force whether to force the download dialog to pop
  2647.  * @param optional integer $filesize send the Content-Header and length to the browser
  2648.  * @return void 
  2649.  */
  2650. function SendDownloadHeaders($type0$type1$filename$force$filesize=0{
  2651.     global $languages$squirrelmail_language;
  2652.     $isIE $isIE6plus false;
  2653.  
  2654.     sqgetGlobalVar('HTTP_USER_AGENT'$HTTP_USER_AGENTSQ_SERVER);
  2655.  
  2656.     if (strstr($HTTP_USER_AGENT'compatible; MSIE '!== false &&
  2657.             strstr($HTTP_USER_AGENT'Opera'=== false{
  2658.         $isIE true;
  2659.     }
  2660.  
  2661.     if (preg_match('/compatible; MSIE ([0-9]+)/'$HTTP_USER_AGENT$match&&
  2662.         ((int)$match[1]>= && strstr($HTTP_USER_AGENT'Opera'=== false{
  2663.         $isIE6plus true;
  2664.     }
  2665.  
  2666.     if (isset($languages[$squirrelmail_language]['XTRA_CODE']&&
  2667.             function_exists($languages[$squirrelmail_language]['XTRA_CODE'])) {
  2668.         $filename =
  2669.             $languages[$squirrelmail_language]['XTRA_CODE']('downloadfilename'$filename$HTTP_USER_AGENT);
  2670.     else {
  2671.         $filename preg_replace('/[\\\\\/:*?"<>|;]/''_'str_replace('&#32;'' '$filename));
  2672.     }
  2673.  
  2674.     // A Pox on Microsoft and it's Internet Explorer!
  2675.     //
  2676.     // IE has lots of bugs with file downloads.
  2677.     // It also has problems with SSL.  Both of these cause problems
  2678.     // for us in this function.
  2679.     //
  2680.     // See this article on Cache Control headers and SSL
  2681.     // http://support.microsoft.com/default.aspx?scid=kb;en-us;323308
  2682.     //
  2683.     // The best thing you can do for IE is to upgrade to the latest
  2684.     // version
  2685.     //set all the Cache Control Headers for IE
  2686.     if ($isIE{
  2687.         $filename=rawurlencode($filename);
  2688.         header ("Pragma: public");
  2689.         header ("Cache-Control: no-store, max-age=0, no-cache, must-revalidate")// HTTP/1.1
  2690.         // does nothing - see: https://blogs.msdn.microsoft.com/ieinternals/2009/07/20/internet-explorers-cache-control-extensions/
  2691.         // header ("Cache-Control: post-check=0, pre-check=0", false);
  2692.         header ("Cache-Control: private");
  2693.  
  2694.         //set the inline header for IE, we'll add the attachment header later if we need it
  2695.         header ("Content-Disposition: inline; filename=$filename");
  2696.     }
  2697.  
  2698.     if (!$force{
  2699.         // Try to show in browser window
  2700.         header ("Content-Disposition: inline; filename=\"$filename\"");
  2701.         header ("Content-Type: $type0/$type1; name=\"$filename\"");
  2702.     else {
  2703.         // Try to pop up the "save as" box
  2704.  
  2705.         // IE makes this hard.  It pops up 2 save boxes, or none.
  2706.         // http://support.microsoft.com/support/kb/articles/Q238/5/88.ASP
  2707.         // http://support.microsoft.com/default.aspx?scid=kb;EN-US;260519
  2708.         // But, according to Microsoft, it is "RFC compliant but doesn't
  2709.         // take into account some deviations that allowed within the
  2710.         // specification."  Doesn't that mean RFC non-compliant?
  2711.         // http://support.microsoft.com/support/kb/articles/Q258/4/52.ASP
  2712.  
  2713.         // all browsers need the application/octet-stream header for this
  2714.         header ("Content-Type: application/octet-stream; name=\"$filename\"");
  2715.  
  2716.         // http://support.microsoft.com/support/kb/articles/Q182/3/15.asp
  2717.         // Do not have quotes around filename, but that applied to
  2718.         // "attachment"... does it apply to inline too?
  2719.         header ("Content-Disposition: attachment; filename=\"$filename\"");
  2720.  
  2721.         if ($isIE && !$isIE6plus{
  2722.             // This combination seems to work mostly.  IE 5.5 SP 1 has
  2723.             // known issues (see the Microsoft Knowledge Base)
  2724.  
  2725.             // This works for most types, but doesn't work with Word files
  2726.             header ("Content-Type: application/download; name=\"$filename\"");
  2727.             // This is to prevent IE for MIME sniffing and auto open a file in IE
  2728.             header ("Content-Type: application/force-download; name=\"$filename\"");
  2729.             // These are spares, just in case.  :-)
  2730.             //header("Content-Type: $type0/$type1; name=\"$filename\"");
  2731.             //header("Content-Type: application/x-msdownload; name=\"$filename\"");
  2732.             //header("Content-Type: application/octet-stream; name=\"$filename\"");
  2733.         else if ($isIE{
  2734.              // This is to prevent IE for MIME sniffing and auto open a file in IE
  2735.              header ("Content-Type: application/force-download; name=\"$filename\"");
  2736.         else {
  2737.             // another application/octet-stream forces download for Netscape
  2738.             header ("Content-Type: application/octet-stream; name=\"$filename\"");
  2739.         }
  2740.     }
  2741.  
  2742.     //send the content-length header if the calling function provides it
  2743.     if ($filesize 0{
  2744.         header("Content-Length: $filesize");
  2745.     }
  2746.  
  2747. }  // end fn SendDownloadHeaders

Documentation generated on Mon, 13 Jan 2020 04:25:01 +0100 by phpDocumentor 1.4.3