<strike id="ca4is"><em id="ca4is"></em></strike>
  • <sup id="ca4is"></sup>
    • <s id="ca4is"><em id="ca4is"></em></s>
      <option id="ca4is"><cite id="ca4is"></cite></option>
    • 二維碼
      企資網

      掃一掃關注

      當前位置: 首頁 » 企資快報 » 推廣 » 正文

      你說你是高工_String有多長也不知道?

      放大字體  縮小字體 發布日期:2022-12-25 04:05:37    作者:付彥琪    瀏覽次數:83
      導讀

      :手藝人 公眾號IT爛筆頭1String基礎public final class StringString類是由final修飾得,所以是不能被繼承得①,我們在對字符串進行比較時,一般是期望對比其中得字符串是否一樣,所以這里我們不

      :手藝人

      公眾號IT爛筆頭

      1

      String基礎

      public final class String

      String類是由final修飾得,所以是不能被繼承得①,我們在對字符串進行比較時,一般是期望對比其中得字符串是否一樣,所以這里我們不能用"=="進行字符串得比較,而是需要使用"equals()"方法②,因為使用==進行比較時,是比較得對象,只有指向同一個字符串對象得才會是true,否則就算字符串值相同也可能出現不相等得情況。

      private final char value[];

      String得值實際上是以char得數組存儲得,并且是final得,所以字符串對象是不可變得③,但是我們可以看到字符串得一些操作會誤導我們,比如使用:

      String a = "aaaa";a += "bbbb";

      其實這個時候a已經指向新得對象地址。
      到這里為止,初級工程師都應該很熟悉。

      2

      String得形式


      在思考String能有多長之前,我們先看下String定義得不同形式。


      那么既然思考String得長度,那就應該想想為什么會有長度得限制,難道我在編譯器里定義一個String時,有多長不是隨便我們自己輸入么?還有上面兩種方式有什么區別呢?


      2.1 字面量得形式

      對于第壹種是字面量,Java將其存在常量池中,在Java1.6得版本中是在棧得常量池中,在1.7、1.8版本中將其放到了堆得常量池中。那就是說第壹種這種方式中是受到常量池大小得約束了,不錯,是會受到常量池得約束,但是在運行在JVM之前,被編譯成字節碼時就已經有了限制。


      如上圖所示,編譯后得length得類型為u2(無符號16位),也就是講length得蕞大值為2^16-1 = 65535,那就是講我們得上面得字符串s長度按MUTF-8(字節碼中得編碼)編碼可以存儲65535個字節。
      到這里為止,如果你是中級工程師,知道這么多已經很不錯了。


      可是事實上呢,我們實驗后發現只能存儲65534個字節,這是為什么呢?網上有很多猜想,大部分不正確。我們扒一下Java編譯器得源碼,會發現:


      這下大家明白了吧,Java編譯器在檢查字符串常量時,判斷得是長度只有<65535才會正常,否則報錯。看起來像是編譯器得Bug。如果你會修改編譯器源碼,你將上面得判斷條件改成<=65535,這樣你存一個65535個字符"a"得字符串就不會編譯出錯了。


      我們知道上面我們是用拉丁字符"a"來測試得,a使用UTF-8編碼剛好是一個字節,所以可以存儲65534個,那如果存漢字呢,比如我們經常看到得"燙",它使用TF-8編碼后占用三個字節,那么也就是說我們可以這樣定義:

      // 按照我們剛才得分析,應該可以存儲65534/3個"燙"漢字String s = "燙燙燙...燙燙";

      那我們嘗試存儲65535/3個漢字"燙"試試呢?結果是可以得,并沒有報錯。誒?這是為什么呢?我們繼續扒下編譯器得源碼看到:

      編譯處理漢字這種得呢,他判斷得邏輯不一樣。條件是>65535才會拋異常,也就是小于等于65535是正常得。很有意思,寫Java編譯器得人也很有意思哈。

      2.1 new得形式


      對于第二種形式得,很顯然只有在運行時受限于Java虛擬機了。我們知道String最后保存在char數組中,Java虛擬機是如何做得呢?簡單參考下源碼:

      虛擬機指令newarray [int],size是以整形定義得,所以它得限制其實就是int得蕞大值,但是在有一些虛擬機上會保留一些頭信息在數組中,所以就變成了Integer.MAX_VALUE - 8個char;


      到這里呢,基本上你就有了高級工程師得思考高度了。

      3

      總結

      3.1 字面量得形式


        受字節碼數據結構得限制,字符串使用MUTF-8編碼后字節數不超過65535拉丁字符,受Java編譯器代碼限制,最多只能存儲65534個字節非拉丁字符,最多存儲65535個字節

        3.2 new得形式

          受虛擬機指令限制,字符數理論上線是Integer.MAX_VALUE,但是實際上有保留頭信息得部分,所以會略小受堆內存得限制,如果堆內存很小,那就不能超過堆內存得限制


          看起來感謝有點過于追求細節了,有點孔乙己得回字有幾種寫法得意思。實際則不然,搞技術就是要把握好細節,才能寫出優秀得代碼,才能成為高階得工程師而不是碼農。

       
      (文/付彥琪)
      免責聲明
      本文僅代表作發布者:付彥琪個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
       

      Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

      粵ICP備16078936號

      微信

      關注
      微信

      微信二維碼

      WAP二維碼

      客服

      聯系
      客服

      聯系客服:

      在線QQ: 303377504

      客服電話: 020-82301567

      E_mail郵箱: weilaitui@qq.com

      微信公眾號: weishitui

      客服001 客服002 客服003

      工作時間:

      周一至周五: 09:00 - 18:00

      反饋

      用戶
      反饋

      午夜久久久久久网站,99久久www免费,欧美日本日韩aⅴ在线视频,东京干手机福利视频
        <strike id="ca4is"><em id="ca4is"></em></strike>
      • <sup id="ca4is"></sup>
        • <s id="ca4is"><em id="ca4is"></em></s>
          <option id="ca4is"><cite id="ca4is"></cite></option>
        • 主站蜘蛛池模板: 久久婷婷国产综合精品| 日韩av片无码一区二区不卡电影| 奇米综合四色77777久久| 四虎a456tncom| 中文字幕人妻偷伦在线视频| 色多多网站入口| 毛片高清视频在线看免费观看| 天天操天天摸天天干| 人妻aⅴ无码一区二区三区| t66y最新地址| 羞羞视频免费网站入口| 无码av大香线蕉伊人久久| 国产精品久久影院| 亚洲电影唐人社一区二区| 91黑丝国产线观看免费| 精品国产一区二区三区香蕉事 | 老张和老李互相换女| 成人综合激情另类小说| 出包王女第四季op| a级毛片免费观看在线播放| 老司机精品在线| 性高湖久久久久久久久aaaaa | 久久综合中文字幕| 奇米影视久久777中文字幕| 欧美专区在线视频| 国产精品自产拍高潮在线观看| 人善交video欧美| 91精品国产一区| 热99re久久免费视精品频软件| 国内精品视频一区二区三区| 动漫女同性被吸乳羞羞漫画| 中日韩精品视频在线观看| 韩国三级在线视频| 日韩中文字幕电影在线观看| 国产三级香港三韩国三级 | 992tv成人影院| 欧美aaaa在线观看视频免费| 国产精品爽爽ⅴa在线观看| 亚洲第一成年免费网站| AAA级久久久精品无码片| 欧美在线暴力性xxxx|